ntAnh-dev commited on
Commit
10c543f
·
verified ·
1 Parent(s): 0b62c26

Add new SentenceTransformer model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,5 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
37
+ unigram.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 384,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,1374 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - dense
7
+ - generated_from_trainer
8
+ - dataset_size:4485
9
+ - loss:MultipleNegativesRankingLoss
10
+ base_model: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
11
+ widget:
12
+ - source_sentence: Thời gian xin rút một học phần là bao giờ?
13
+ sentences:
14
+ - 'Quy định công nhận tín chỉ và chuyển đổi kết quả học phần tương đương
15
+
16
+ Điều 2, Học phần được công nhận tín chỉ
17
+
18
+ 1. Các loại học phần được công nhận tín chỉ bao gồm các học phần giáo dục quốc
19
+
20
+ phòng-an ninh, lý luận chính trị, pháp luật đại cương, ngoại ngữ cơ bản/cơ sở,
21
+ giáo dục
22
+
23
+ thể chất; các học phần cốt lõi ngành/chuyên ngành; học phần thực hành, thực tập;
24
+ các
25
+
26
+ chuyên đề nghiên cứu. Không chuyến đổi kết quả học phân đồ án/khóa luận tốt nghiệp
27
+
28
+ đại học, luận văn thạc sĩ, luận án tiến sĩ.
29
+
30
+ 2. Khối lượng của 01 (một) tín chỉ được tính theo quy định hiện hành của Trường
31
+
32
+ ĐHBK Hà Nội. Chỉ những học phần đã hoàn thành ở đơn vị đối tác có kết quả đạt
33
+ từ
34
+
35
+ 4,0 theo thang điểm 10 hoặc điểm D theo thang điểm chữ trở lên mới được xét công
36
+
37
+ nhận tín chỉ và chuyên đổi kết quả sang học phần tương đương thuộc chương trình
38
+ đào
39
+
40
+ †ạo của Trường.
41
+
42
+ 3. Các học phần hoặc mô-đun (gồm một nhóm học phần) được công nhận tín chỉ
43
+
44
+ nếu được khoa/viện phụ trách giảng dạy chấp thuận trên cơ sở đối sánh về chuẩn
45
+ đầu T8,
46
+
47
+ kiến thức, nội dung, thời lượng và hình thức giảng dạy (lý thuyết, bài tập, thực
48
+ hành, thí
49
+
50
+ nghiệm) và cách thức đánh giá học phần. Số tín chỉ được công nhận, chuyển đổi
51
+ phải
52
+
53
+ lớn hơn hoặc bằng số tín chỉ của học phần hoặc mô-đun trong chương trình của Trường
54
+
55
+ ĐHBK Hà Nội.
56
+
57
+ 4. Các học phần được công nhận sẽ được tính tín chỉ tích lũy và ghi điểm cho học
58
+
59
+ phần tương ứng trong bảng điểm của sinh viên để tính điểm trung bình tích lũy
60
+ (CPA),
61
+
62
+ (chỉ tiết trong Phụ lục I). Trường hợp sinh viên có kết quả của một học phần “đạt”
63
+ theo
64
+
65
+ cách đánh giá của đơn vị đối tác thì học phần đó được công nhận tín chỉ và với
66
+ điểm R.
67
+
68
+ (điểm miễn) và không sử dụng để tính điểm CPA.
69
+
70
+ 5. Mỗi sinh viên chỉ được xét công nhận tối đa 30 tín chỉ.
71
+
72
+ '
73
+ - 'Quy chế đào tạo đại học bách khoa Hà Nội 2025
74
+
75
+ CHƯƠNG IV
76
+
77
+ ĐÀO TẠO THẠC SĨ
78
+
79
+ Điều 35. Nghỉ học tạm thời và bảo lưu kết quả học tập
80
+
81
+ 1. Đối với học viên được điều động vào lực lượng vũ trang, đi làm nghĩa vụ quốc
82
+ gia,
83
+
84
+ quốc tế, thời gian nghỉ học tạm thời (là thời gian được ghi trong quyết định của
85
+ cấp có
86
+
87
+ thẩm quyền) không tính vào thời gian học tại ĐHBK Hà Nội.
88
+
89
+ 2. Học viên bị ốm hoặc tai nạn buộc phải điều trị trong thời gian dài, hoặc nghỉ
90
+ thai
91
+
92
+ sản theo quy định được phép nghỉ học tạm thời. T hời gian nghỉ học tạm thời (là
93
+ thời gian
94
+
95
+ được ghi trong giấy xác nhận của cơ sở khám, chữa bệnh có thẩm quyền theo quy
96
+ định của
97
+
98
+ Bộ Y tế) không tính vào thời gian chậm tiến độ nếu tổng cộng không vượt quá 2
99
+ học kỳ
100
+
101
+ chính; thời gian nghỉ trên 2 học kỳ được tính vào thời gian học chậm tiến độ.
102
+
103
+ 3. Đối với trường hợp xin nghỉ học tạm thời vì những lý do khác với lý do tại
104
+ khoản
105
+
106
+ 1 và khoản 2 Điều này, học viên phải học ít nhất một học kỳ tại ĐHBK Hà Nội, không
107
+
108
+ thuộc các trường hợp bị xem xét buộc thôi học hoặc xem xét kỷ luật, mới được xem
109
+ xét
110
+
111
+ cho nghỉ học tạm thời. Thời gian nghỉ học tối đa là 12 tháng và được tính vào
112
+ thời gian học
113
+
114
+ tập.
115
+
116
+ 4. Học viên phải nộp đơn đề nghị trở lại học chậm nhất 01 tuần trước khi bắt đầu
117
+ học
118
+
119
+ kỳ mới. Đối với trường hợp được điều động vào lực lượng vũ trang hoặc đi làm nghĩa
120
+ vụ
121
+
122
+ quốc gia, quốc tế, học viên phải nộp kèm theo giấy xác nhận đã hoàn thành nhiệm
123
+ vụ.
124
+
125
+ 5. Chế độ bảo lưu kết quả học tập khi nghỉ học tạm thời: Các học phần đăng ký
126
+ học
127
+
128
+ trong học kỳ đã đủ điểm đánh giá hoặc đủ điều kiện đánh giá sẽ được tính điểm
129
+ học phần;
130
+
131
+ kết quả sẽ được bảo lưu cùng với kết quả từ các học kỳ trước, kể cả các học phần
132
+ đạt v à
133
+
134
+ không đạt.
135
+
136
+
137
+ '
138
+ - 'Quy chế đào tạo đại học bách khoa Hà Nội 2023
139
+
140
+ CHƯƠNG II
141
+
142
+ ĐÀO TẠO ĐẠI HỌC
143
+
144
+ Điều 16. Nghỉ học tạm thời và tự nguyện thôi học
145
+
146
+ 1. Điều kiện nghỉ học tạm thời, thời gian nghỉ học tối đa và việc tiếp nhận trở
147
+ lại
148
+
149
+ học được quy định như sau:
150
+
151
+ a) Sinh viên đư ợc nghỉ học t ạm thời nếu có quyết đ ịnh cho phép nghỉ học tạ
152
+ m
153
+
154
+ thời của Giám đốc ĐHBK Hà Nội.
155
+
156
+ b) Thời gian nghỉ học tạm thời do sinh viên bị ốm, thai sản ho ặc tai nạn buộc
157
+
158
+ phải điều trị thời gian dài không tính vào thờ i gian chậm tiến độ nếu tổng cộng
159
+ không
160
+
161
+ vượt quá 4 h ọc kỳ c hính; thời gian nghỉ trên 4 học kỳ được tính vào thời gian
162
+ học
163
+
164
+ chậm tiến độ.
165
+
166
+ c) Thời gian nghỉ học tạm thời do sinh viên được điều độn g vào lực lượng vũ
167
+
168
+ trang (là thời gian được ghi trong qu yết định của cấp có thẩm quyền) không tính
169
+ v ào
170
+
171
+ thời gian học chậm tiến độ.
172
+
173
+ d) Đối với trườn g hợp xin ngh ỉ học tạm thời vì những lý do khác với lý do tại
174
+
175
+ điểm b và điểm c khoản 1 của Điều này, sinh viên phải học ít nhất một học kỳ.
176
+ Thời
177
+
178
+ gian nghỉ học tối đa cho phép là 4 học kỳ chính và được tính vào th ời gian học
179
+ c hậm
180
+
181
+ tiến độ.
182
+
183
+ đ) Sinh viên phải nộp đơn đề nghị trở lại học chậm nhất 1 tuần trước khi bắt đầu
184
+
185
+ học kỳ mới. Đối với trường hợp được điều động và o lực lượng vũ trang hoặc đi
186
+ làm
187
+
188
+ nghĩa vụ quốc tế, sinh viên phải nộp kèm theo giấy xác nhận đã hoàn thành nhiệm
189
+ vụ.
190
+
191
+ 2. Chế độ bảo lư u kết quả họ c tập khi ng hỉ học tạm thời: Các học phần đăng
192
+
193
+
194
+ học trong học kỳ đã đủ điểm đánh giá hoặc đủ điều kiện đánh g iá sẽ được tính
195
+ điểm
196
+
197
+ học phần; kết quả sẽ được bảo lưu cùng với kết quả từ các học kỳ trước, kể cả
198
+ cá c học
199
+
200
+ phần đạt và không đạt.
201
+
202
+ 3. Tự nguyện thôi học: Sin h viên thấy không có đủ điều kiện hoặc không muốn
203
+
204
+ tiếp tục học tại ĐHBK Hà Nội có thể làm đơn đề n ghị thôi học và đượ c xem xét
205
+ cho
206
+
207
+ thôi học. Sinh viên đã có quyết định cho thôi học không được tiếp nhận trở lại.
208
+
209
+
210
+ '
211
+ - source_sentence: Quy định về việc xét cấp học bổng cho sinh viên xem tại?
212
+ sentences:
213
+ - 'KHUNG ĐÁNH GIÁ KẾT QUẢ RÈN LUYỆN SINH VIÊN 2020-2021
214
+
215
+ Sinh viên bị trừ điểm nếu vi phạm các quy định sau đây
216
+
217
+ Điểm ý thức công dân trong quan hệ cộng đồng (tối đa 20 điểm)
218
+
219
+ Vi phạm trong học tập
220
+
221
+ Vi phạm quy chế thi từ cảnh cáo trở lên; minh chứng: dựa trên hệ thống quản lý;
222
+ điểm: -10
223
+
224
+ Bị kỷ luật khi thi hộ; minh chứng: dựa trên hệ thống quản lý; điểm: -20
225
+
226
+ Vi phạm quy định về an ninh trật tự, an toàn giao thông, giữ gìn vệ sinh, cảnh
227
+ quan môi trường, nếp
228
+
229
+ sống văn minh bị Hội đồng kỷ luật của Trường ra quyết định kỷ luật tương ứng với
230
+ các mức
231
+
232
+ Vi phạm ở mức độ Khiển trách; minh chứng: dựa trên hệ thống quản lý; điểm: -6
233
+
234
+ Vi phạm ở mức độ Cảnh cáo; minh chứng: dựa trên hệ thống quản lý; điểm: -9
235
+
236
+ Vi phạm ở mức độ Kỷ luật buộc thôi học, tạm dừng; minh chứng: dựa trên hệ thống
237
+ quản lý; điểm: -12
238
+
239
+ Vi phạm pháp luật
240
+
241
+ Vi phạm pháp luật thuộc nhóm tội danh hình sự; minh chứng: dựa trên hệ thống quản
242
+ lý; điểm: -50'
243
+ - 'Quy định về Học bổng Trần Đại Nghĩa
244
+
245
+ Chương III TỔ CHỨC THỰC HIỆN
246
+
247
+ Điều 10. Hội đồng xét, cấp Học bổng Trần Đại Nghĩa
248
+
249
+ 1. Hội đồng xét, cấp Học bổng Trần Đại Nghĩa được thành l ập theo quy ết định
250
+
251
+ của Giám đốc Đại học, có trách nhiệm giúp Giám đốc trong việc:
252
+
253
+ a) Xét, cấp Học bổng Trần Đại Nghĩa trên cơ sở Quy định này;
254
+
255
+ b) Đề xuất sửa đổi, bổ sung quy định về việc quản lý và xét , cấp Học bổng Tr���n
256
+
257
+ Đại Nghĩa.
258
+
259
+ 2) Thành viên Hội đồng xét, cấp Học bổng Trần Đại Nghĩa gồm:
260
+
261
+ a) Chủ tịch Hội đồng: Là Phó Giám đốc Đại học phụ trách công tác sinh viên;
262
+
263
+ b) Thường trực Hội đồng: Là Trưởng Phòng/Ban chức năng Công tác sinh viên;
264
+
265
+ c) Các thành viên khác của H ội đ ồng là đ ại di ện các đơn v ị: Phòng/Ban chức
266
+
267
+ năng Công tác sinh viên, Đào tạo, Tài chính - Kế toán, Đoàn Thanh niên Cộng sản
268
+ Hồ
269
+
270
+ Chí Minh, Hội Sinh viên ĐHBK Hà Nội và đại diện các đơn vị có liên quan khác.
271
+
272
+ '
273
+ - 'Quy chế đào tạo đại học bách khoa Hà Nội 2023
274
+
275
+ CHƯƠNG II
276
+
277
+ ĐÀO TẠO ĐẠI HỌC
278
+
279
+ Điều 10. Đăng ký học tập chương trình đại học
280
+
281
+ 4. Đối với học phần có giờ lên lớp, chỉ mở lớp khi có tối thiểu 20 sinh viên đăng
282
+
283
+ ký học. Các trường hợp ngoại lệ được giải quyết như sau:
284
+
285
+ a) Xem xét mở lớp cho các ngành học hoặc các chương trình ELITECH có ít sinh
286
+
287
+ viên để tạo điều kiện tối đa cho sinh viên học theo kế hoạch học tập chuẩn.
288
+
289
+ b) Xem xét mở lớp học phần có t ừ 5 đến 1 9 sinh viên đăng ký học theo đề nghị
290
+
291
+ của sinh viên, áp dụng hệ số học phí theo quy định.
292
+
293
+ c) Xem xét mở lớp dưới 5 sinh viên đăng ký học lại học ph ần dưới hình thức làm
294
+
295
+ đồ án môn học.
296
+
297
+
298
+ CHƯƠNG II
299
+
300
+ ĐÀO TẠO ĐẠI HỌC
301
+
302
+ Điều 11. Công nhận kết quả học tập và chuyển đổi tín chỉ
303
+
304
+ 1. Kết quả học tập của ngườ i học đã tích lũy t ừ một trình độ đào tạo khác, một
305
+
306
+ CTĐT khác hoặc từ một cơ sở đào tạo khác được xem xét công nhận, chuyển đổi sang
307
+
308
+ TC của những học phần trong CTĐT.
309
+
310
+ 2. Xem xét công nhận, chuyển đổi TC trên cơ sở đối sánh chuẩn đầu ra, nội dung
311
+
312
+ và khối lư ợng học tập, cách t hức đá nh giá học phần và c ác điều kiện bảo đảm
313
+ chất
314
+
315
+ lượng thực hiện chương trình theo các cấp độ:
316
+
317
+ a) Công nhận, chuyển đổi theo từng học phần;
318
+
319
+ b) Công nhận, chuyển đổi theo từng nhóm học phần.
320
+
321
+ 3. Sinh viên được phép t hực hiện đồ án/khóa luận tốt nghiệp tại một cơ sở trong
322
+
323
+ nước (cơ sở giáo dục đại học , viện nghiên cứu, doanh nghiệp,…) hoặc tại một cơ
324
+ sở
325
+
326
+ đào tạo ở nước ng oài theo chương trình trao đổi sinh viên đã được ký kết nhưng
327
+ phải
328
+
329
+ bảo vệ tại ĐHBK Hà Nội để được đán h giá và cho điểm. Với sinh viên thuộc các
330
+
331
+ CTĐT theo hình thức VLVH tại đơn vị liên kết, việc đánh giá ĐATN được phép thực
332
+
333
+ hiện tại đơn vị liên kết hoặc tại ĐHBK Hà Nội.
334
+
335
+ 4. Khối lượng tối đa được công nhận, chuyển đổi không vượt quá 50% khối
336
+
337
+ lượng chương trình học tập toàn khóa.
338
+
339
+ 5. Sinh viên đã có q uyết định cho thôi học hoặc buộc thôi học, nếu thi lại và
340
+
341
+ trúng tuyển thì phải học lại toàn bộ chương trình, n goại trừ chương trình Giáo
342
+ dục
343
+
344
+ quốc phòng-an ninh đã được cấp chứng chỉ.
345
+
346
+
347
+ '
348
+ - source_sentence: ' Địa chỉ email ssu@hust.edu.vn là địa chỉ tiếp nhận thông tin
349
+ của?'
350
+ sentences:
351
+ - 'Quy chế Công tác sinh viên Đại học Bách Khoa Hà Nội
352
+
353
+ Chương II TRÁCH NHIỆM VÀ QUYỀN LỢI CỦA SINH VIÊN
354
+
355
+ Điều 6. Quyền lợi của sinh viên
356
+
357
+ 12. Được cung cấp các giấy tờ cần thiết, hỗ trợ các thủ tục tìm kiếm việc làm
358
+ sau
359
+
360
+ khi tốt nghiệp.
361
+
362
+ 13. Được hưởng đầy đủ các chế độ, chính sách theo quy định hiện hành của Nhà
363
+
364
+ nước và của Đại học.
365
+
366
+ 14. Được xét vào ở trong ký túc xá của Đại học (nếu có nguyện vọng và đáp ứng
367
+
368
+ các điều kiện theo quy định của Đại học) hoặc được hỗ trợ tìm kiếm chỗ ở.
369
+
370
+ 15. Được chăm lo, bảo vệ sức khỏe theo chế độ hiện hành của Nhà nước và của
371
+
372
+ Đại học.
373
+
374
+ 16. Sinh viên là người khuyết tật hoặc không đủ sức khỏe học một số nội dung
375
+
376
+ thuộc các học phần giáo dục thể chất, giáo dục quốc phòng được xem xét miễn, giảm
377
+
378
+ các nội dung không phù hợp hoặc được học các nội dung thay thế phù hợp theo hiện
379
+
380
+ trạng sức khỏe.
381
+
382
+ 17. Được cấp bằng tốt nghiệp đại học theo quy định của Đại học.
383
+
384
+ Chương II TRÁCH NHIỆM VÀ QUYỀN LỢI CỦA SINH VIÊN
385
+
386
+ Điều 7. Các hành vi sinh viên không được làm
387
+
388
+ 1. Xúc phạm nhân phẩm, danh dự, xâm phạm thân thể nhà giáo, cán bộ quản lý,
389
+
390
+ viên chức, người lao động và người học của Đại học và người khác.
391
+
392
+ '
393
+ - 'Quy định tổ chức dạy, học và đánh giá kết quả học tập môn học Giáo dục quốc phòng
394
+ và an ninh trong các cơ sở giáo dục nghề nghiệp, cơ sở giáo dục đại học
395
+
396
+ Chương I NHỮNG QUY ĐỊNH CHUNG
397
+
398
+ Điều 3. Nguyên tắc, yêu cầu dạy, học môn học GDQP&AN
399
+
400
+ 1. Dạy, học môn h ọc GDQP&AN ph ải bảo đảm tính toàn di ện, có tr ọng tâm,
401
+
402
+ trọng điểm bằng các hình th ức phù hợp; kết hợp giữa lý luận và thực tiễn, giữa
403
+
404
+
405
+ thuyết và thực hành; phù h ợp với quy chế tổ chức đào tạo của từng trình độ; phải
406
+
407
+ gắn liền với giáo d ục ý th ức tổ chức kỷ luật, tinh th ần tập thể; dạy, học môn
408
+ h ọc
409
+
410
+ GDQP&AN tại các cơ sở giáo dục phải gắn kết với giáo dục thực tế, kỹ năng thực
411
+
412
+ hành và hoạt động ngoại khóa.
413
+
414
+ 2. Giáo viên, gi ảng viên dạy GDQP&AN khi gi ảng dạy tại giảng đường hoặc
415
+
416
+ trên thao trường phải mang mặc trang phục GDQP&AN theo quy định; giáo viên,
417
+
418
+ giảng viên là s ĩ quan quân đội, công an bi ệt phái ph ải mang m ặc theo Điều
419
+ lệnh
420
+
421
+ quân đội, công an nhân dân.
422
+
423
+ 3. Giáo viên, giảng viên, cán bộ quản lý, học sinh, sinh viên gi ảng dạy và học
424
+
425
+ tập môn học GDQP&AN phải thực hiện đúng, đủ kế hoạch giảng dạy, học tập, nội
426
+
427
+ quy, quy tắc về đảm bảo an toàn về người, vũ khí, trang thiết bị.
428
+
429
+ '
430
+ - 'Xin thôi học và rút hồ sơ sinh viên; Tiêu đề email: Không có; Gửi email tới:
431
+ hue.nguyenkim@hust.edu.vn - Chuyên viên Nguyễn Kim Huệ (bàn 6, phòng 202A-C1).;
432
+ Tải mẫu đơn tại đây: https://husteduvn.sharepoint.com/:w:/s/NguyenXuanTung_PDT/EdHS7TFGfW1GouXPZU8amNYB9FPwsAvAE_inGumXQak7sw?e=FMR8BW
433
+
434
+ Xin nghỉ học dài hạn (bảo lưu); Tiêu đề email: [Nghỉ học]; Gửi email tới: hue.nguyenkim@hust.edu.vn
435
+ - Chuyên viên Nguyễn Kim Huệ (bàn 6, phòng 202A-C1).; Tải mẫu đơn tại đây: https://husteduvn.sharepoint.com/:w:/s/NguyenXuanTung_PDT/EVDUxHPtC3NPptlLvYd5yYYB_FjFWCrApxPOkpmQXCfITw?e=0NeFGR
436
+
437
+ Tiếp nhận trở lại học sau khi nghỉ dài hạn; Tiêu đề email: [Tiếp nhận học]; Gửi
438
+ email tới: hue.nguyenkim@hust.edu.vn; Tải mẫu đơn tại đây: https://husteduvn-my.sharepoint.com/:w:/g/personal/tung_nguyenxuan_hust_edu_vn/EXEs6fONK31LrbYT2EW7quoB4PLCIFTqDDFOZP7CivpPgQ?e=K8334Y
439
+
440
+ Thủ tục chuyển trường trong nước; Tiêu đề email: Không có; Gửi email tới: hue.nguyenkim@hust.edu.vn
441
+ - Chuyên viên Nguyễn Kim Huệ (bàn 6, phòng 202A-C1).; Tải mẫu đơn tại đây: https://husteduvn.sharepoint.com/:w:/s/NguyenXuanTung_PDT/ETUYBfTNy3pAuTpkOFc9jMsBZjSpCv88OO5JF7nhKXVqzg?e=QeoeB0
442
+
443
+ Chuyển ngành đào tạo/chương trình đào tạo; Tiêu đề email: [Chuyển ngành]; Gửi
444
+ email tới: hue.nguyenkim@hust.edu.vn - Chuyên viên Nguyễn Kim Huệ (202A-C1).;
445
+ Tải mẫu đơn tại đây: https://husteduvn-my.sharepoint.com/:w:/g/personal/tung_nguyenxuan_hust_edu_vn/Eac_2dIx5UxFibtK1sKbV4IBB2f0pDcfQa5_wfTrYIHv3A?e=vfxa1a
446
+
447
+ Chuyển sang học tại Trung tâm Đào tạo liên tục; Tiêu đề email: [Chuyển hệ ĐTLT];
448
+ Gửi email tới: hue.nguyenkim@hust.edu.vn / dtlt@hust.edu.vn; Tải mẫu đơn tại đây:
449
+ https://husteduvn.sharepoint.com/:w:/s/NguyenXuanTung_PDT/EUyvO31qrjRDii9fHOAs-50Bz9-YJC3GgQnUXjbslCY4ZA?e=AAyYZH
450
+
451
+ Trích sao bảng điểm (dành cho SV đang học); Tiêu đề email: [Trích sao]; Gửi email
452
+ tới: hanh.tranthi@hust.edu.vn; Tải mẫu đơn tại đây: https://husteduvn.sharepoint.com/:w:/s/NguyenXuanTung_PDT/EeCW4MRDLJZNkQDxHz7nv4ABofH2fz-g9Fi3IIB_KH9u9w?e=Uxz5XH
453
+
454
+ Lịch thi học kỳ; Tiêu đề email: [Lịch thi]; Gửi email tới: hanh.tranthi@hust.edu.vn
455
+ / huong.giang@hust.edu.vn; Tải mẫu đơn tại đây: Không có'
456
+ - source_sentence: Địa chỉ Phòng Công tác Sinh viên?
457
+ sentences:
458
+ - 'Quy chế đào tạo đại học bách khoa Hà Nội 2023
459
+
460
+ CHƯƠNG II
461
+
462
+ ĐÀO TẠO ĐẠI HỌC
463
+
464
+ Điều 12. Ý kiến phản hồi của người học, đánh giá kết quả học tập
465
+
466
+ 3. Kết quả tiến bộ học tập của sinh viên từ đầu khóa được đánh giá trên cơ sở
467
+
468
+ điểm của các học phần đã họ c thuộc CTĐT nhưng không tính các học phần về ngoại
469
+
470
+ ngữ cơ bản, Giáo dục thể chất, Giáo dục quốc phòng -an ninh, thể hiện bằng các
471
+ chỉ s ố
472
+
473
+ sau đây:
474
+
475
+ a) Số TC tích lũy (số TCTL).
476
+
477
+ b) Tổng số TC của các học phần đã học nhưng chưa đạt từ đầu khóa (số TC nợ
478
+
479
+ đọng).
480
+
481
+ c) Điểm trung bình tích lũy (CPA).
482
+
483
+ d) Trình độ ngoại ngữ của sinh viên đạt được theo yêu cầu của CTĐT.
484
+
485
+ 4. Kết quả học tập học kỳ hè được đánh giá ở kỳ chính kế tiếp.
486
+
487
+ 5. Sinh viên được xếp hạng trình độ năm học căn cứ số TC tích lũy (TCTL) như
488
+
489
+ sau:
490
+
491
+ Số TCTL: < 32, Trình độ: Năm thứ nhất
492
+
493
+ Số TCTL: 32 - 63, Trình độ: Năm thứ hai
494
+
495
+ Số TCTL: 64 - 95, Trình độ: Năm thứ ba
496
+
497
+ Số TCTL: 96 -127, Trình độ: Năm thứ tư
498
+
499
+ Số TCTL: ≥ 128, Trình độ: Năm thứ năm
500
+
501
+ '
502
+ - 'Quy chế Công tác sinh viên Đại học Bách Khoa Hà Nội
503
+
504
+ Chương V KHEN THƯỞNG VÀ KỶ LUẬT SINH VIÊN
505
+
506
+ Điều 35. Quyền khiếu nại về khen thưởng và kỷ luật
507
+
508
+ Sinh viên nếu thấy các hình thức khen thưởng hoặc kỷ luật chưa thỏa đáng có
509
+
510
+ quyền khiếu nại lên Giám đốc Đại học qua Ban Công tác sinh viên.
511
+
512
+ Chương VI ĐÁNH GIÁ CÔNG TÁC SINH VIÊN
513
+
514
+ Điều 36. Mục đích đánh giá
515
+
516
+ 1. Đảm bảo sự thống nhất, từng bước chuẩn hoá, nâng cao chất lượng công tác
517
+
518
+ sinh viên, góp phần nâng cao chất lượng, hiệu quả công tác đào tạo của Đại học.
519
+
520
+ 2. Làm căn cứ để các đơn vị quản ngành xây dựng chương trình, kế hoạch hoạt
521
+
522
+ động nhằm củng cố, hoàn thiện và tăng cường công tác sinh viên sau mỗi năm học.
523
+
524
+ 3. Làm cơ sở đề xuất khen thưởng và kỷ luật.
525
+
526
+ Điều 37. Yêu cầu công tác đánh giá
527
+
528
+ 1. Đảm bảo khách quan, toàn diện, đánh giá đúng thực trạng công tác sinh viên
529
+
530
+ của đơn vị quản ngành.
531
+
532
+ 2. Căn cứ đánh giá công tác sinh viên của đơn vị quản ngành dựa trên:
533
+
534
+ a) Mức độ hài lòng của sinh viên về chất lượng phục vụ và hỗ trợ sinh viên của
535
+
536
+ đơn vị;
537
+
538
+ b) Chức năng, nhiệm vụ được giao và hiệu quả tổ chức thực hiện.
539
+
540
+ 3. Việc tự đánh giá, xếp loại công tác sinh viên của đơn vị quản ngành phải căn
541
+
542
+ cứ vào các minh chứng để xác định mức độ đạt được của mỗi nội dung các tiêu chí.
543
+
544
+ '
545
+ - 'Quy chế Công tác sinh viên Đại học Bách Khoa Hà Nội
546
+
547
+ Chương III NỘI DUNG CÔNG TÁC SINH VIÊN
548
+
549
+ Điều 19. Tư vấn tâm lý, chăm sóc sức khỏe sinh viên
550
+
551
+ 1. Tổ chức các hoạt động tư vấn tâm lý, chăm sóc sức khỏe để phòng ngừa và hỗ
552
+
553
+ trợ kịp thời khi sinh viên gặp phải các vấn đề ảnh hưởng đến thể chất và tinh
554
+ thần.
555
+
556
+ 2. Tư vấn và hỗ trợ sinh viên mới nhập học hòa nhập với môi trường học tập
557
+
558
+ mới.
559
+
560
+ 3. Tổ chức khám sức khỏe cho sinh viên mới nhập học và khám sức khỏe định kỳ
561
+
562
+ cho sinh viên; tư vấn, tổ chức cho sinh viên thực hiện Luật bảo hiểm y tế; tổ
563
+ chức sơ,
564
+
565
+ cấp cứu, khám chữa bệnh ban đầu cho sinh viên.
566
+
567
+ Điều 20. Tổ chức các dịch vụ thiết yếu cho sinh viên
568
+
569
+ Tổ chức và hướng dẫn sinh viên sử dụng các dịch vụ thiết yếu phục vụ đời sống,
570
+
571
+ học tập và rèn luyện trong quá trình học tập như: internet, nhà ăn, căng tin,
572
+ trông giữ
573
+
574
+ xe, sân chơi, bãi tập, thiết chế văn hóa…
575
+
576
+ Điều 21. Hỗ trợ tài chính cho sinh viên
577
+
578
+ 1. Hướng dẫn và hỗ trợ sinh viên có hoàn cảnh khó khăn làm thủ tục vay vốn
579
+
580
+ ngân hàng chính sách xã hội.
581
+
582
+ 2. Tăng cường khai thác, quản lý và sử dụng hiệu quả các nguồn tài trợ nhằm
583
+
584
+ khuyến khích sinh viên có kết quả học tập tốt, động viên, hỗ trợ sinh viên có
585
+ hoàn
586
+
587
+ cảnh khó khăn.
588
+
589
+ 3. Quan tâm, hỗ trợ kịp thời những sinh viên có hoàn cảnh đặc biệt khó khăn về
590
+
591
+ kinh tế, sinh viên mồ côi không nơi nương tựa, sinh viên là người khuyết tật,
592
+ sinh viên
593
+
594
+ gặp khó khăn rủi ro đột xuất.
595
+
596
+ 4. Hỗ trợ kinh phí cho sinh viên tham gia các hoạt động nghiên cứu sáng tạo và
597
+
598
+ khởi nghiệp, hoạt động trao đổi sinh viên quốc tế, hoạt động học tập nâng cao
599
+ trình độ
600
+
601
+ ngoại ngữ.
602
+
603
+ '
604
+ - source_sentence: Sinh viên khi đăng ký học phần thì được gì?
605
+ sentences:
606
+ - 'Quy chế đào tạo đại học bách khoa Hà Nội 2023
607
+
608
+ CHƯƠNG II
609
+
610
+ ĐÀO TẠO ĐẠI HỌC
611
+
612
+ Điều 10. Đăng ký học tập chương trình đại học
613
+
614
+ 1. Đăng ký học tập là quy trình bắt buộc của sinh viên cho mỗi học kỳ, trừ các
615
+
616
+ sinh viên mới nhập học được xếp thời khóa biểu theo kế hoạch học tập chuẩn, không
617
+
618
+ phải đăng ký học tập nhưng có thể tự đ iều chỉnh một số lớp. Sinh viên thực hiện
619
+ quy
620
+
621
+ trình đăng ký theo các mốc thời gian của Khung kế hoạch thời gian năm học. Quá
622
+ trình
623
+
624
+ đăng ký học tập gồm 3 giai đoạn:
625
+
626
+ a) Đăng ký học phần: sinh viên chọn đăng ký những học phần dự tính sẽ học
627
+
628
+ trong học kỳ tiếp . Sinh viên c ó thể đăng ký th eo kế hoạch h ọc tập chuẩn hoặc
629
+ theo kế
630
+
631
+ hoạch cá nhân. Thời gian tổ chức đăng ký học phần cho một học kỳ diễn ra vào những
632
+
633
+ tuần đầu của học kỳ trước đó. Dựa trên số lượ ng sinh viên đăng ký, ĐHBK Hà Nội
634
+
635
+ đưa ra số lượng lớp sẽ mở và thời khóa biểu cho các lớp này.
636
+
637
+ b) Đăng ký lớp chính thức: sinh viên chọn lớp học cho những học phần đã đăng
638
+
639
+ ký. Đối với các học phần có nhiều lớp thành phần (lớp lý thuyết, bài tập, thực
640
+ hành , thí
641
+
642
+ nghiệm,..), sinh viên phải đăng ký đủ các lớp thành phần theo yêu cầu.
643
+
644
+ c) Điều chỉnh đăng ký: sinh viên có thể chuyển lớp, hủy lớp hoặc đăng ký lớp bổ
645
+
646
+ sung, kể cả lớp với các học phần chưa đăng ký trước. Mỗi học kỳ chính có hai đợt
647
+ điều
648
+
649
+ chỉnh đăng ký, kết thúc trước khi bắt đầu học kỳ/đợt học. Riêng việc đăng ký bổ
650
+ sung
651
+
652
+ vào các lớp học phần đã mở ch ỉ thực hiện trong tuần đầu của học kỳ/đợt học. Học
653
+ kỳ
654
+
655
+ hè không có đợt điều chỉnh đăng ký.
656
+
657
+ '
658
+ - 'Quy chế Công tác sinh viên Đại học Bách Khoa Hà Nội
659
+
660
+ Chương III NỘI DUNG CÔNG TÁC SINH VIÊN
661
+
662
+ Điều 8. Quản lý thông tin sinh viên
663
+
664
+ 2. Hồ sơ quản lý quá trình học tập, rèn luyện của sinh viên gồm:
665
+
666
+ a) Kết quả học tập (điểm quá trình, điểm kết thúc học phần, kết quả thi hoặc bảo
667
+
668
+ vệ đồ án tốt nghiệp/khoá luận tốt nghiệp) và kết quả rèn luyện (điểm rèn luyện
669
+ theo
670
+
671
+ học kỳ, năm học, khoá học);
672
+
673
+ b) Kết quả các hoạt động xã hội đã tham gia trong từng học kỳ, năm học;
674
+
675
+ c) Hình thức khen thưởng (nếu có) mà sinh viên đạt được trong học tập, nghiên
676
+
677
+ cứu khoa học, hoạt động phong trào, đoàn thể;
678
+
679
+ d) Hình thức kỷ luật (nếu có);
680
+
681
+ đ) Thông tin thay đổi (nếu có) do chuyển chương trình đào tạo, chuyển ngành
682
+
683
+ học, chuyển trường, nghỉ học có thời hạn, thôi học, tốt nghiệp;
684
+
685
+ e) Địa chỉ nơi cư trú;
686
+
687
+ g) Tình trạng đóng học phí;
688
+
689
+ h) Thông tin về việc tham gia bảo hiểm y tế;
690
+
691
+ i) Thông tin kết quả khám sức khỏe cho sinh viên do Đại học tổ chức;
692
+
693
+ k) Các học bổng đã được nhận.
694
+
695
+ '
696
+ - 'Quy chế đào tạo đại học bách khoa Hà Nội 2025
697
+
698
+ CHƯƠNG V
699
+
700
+ ĐÀO TẠO TIẾN SĨ
701
+
702
+ Điều 38. Học phần bổ sung và học phần tiến sĩ
703
+
704
+ 1. Các học phần bổ sung nhằm hỗ trợ NCS có đủ kiến thức, trình độ chuyên môn để
705
+
706
+ thực hiện đề tài nghiên cứu.
707
+
708
+ a) Đối với NCS đã có bằng thạc sĩ: khối lượng kiến thức cần phải học bổ sung được
709
+
710
+ xác định căn cứ vào các học phần đã tích lũy ở trình độ thạc sĩ, kiến thức cần
711
+ cập nhật, bổ
712
+
713
+ sung và yêu cầu của lĩnh vực, đề tài nghiên cứu. Khối lượng kiến thức tối thiểu
714
+ 4 TC tương
715
+
716
+ ứng với 2 học phần.
717
+
718
+ b) Đối với NCS chưa có bằng thạc sĩ: các học phần bổ sung bao gồm toàn bộ học
719
+
720
+ phần của CTĐT thạc sĩ theo định hướng nghiên cứu thuộc ngành tương ứng trừ luận
721
+ văn
722
+
723
+ thạc sĩ.
724
+
725
+ c) NCS đăng ký các học phần bổ sung thuộc chương trình (đại học, thạc sĩ) nào
726
+ thì sẽ
727
+
728
+ học theo lớp học phần thuộc chương trình đó.
729
+
730
+ 2. Các học phần tiến sĩ nhằm nâng cao trình độ lý thuyết, cập nhật các kiến thức
731
+ mới
732
+
733
+ nhất của lĩnh vực chuyên môn, phương pháp nghiên cứu và khả năng ứng dụng các
734
+ phương
735
+
736
+ pháp nghiên cứu trong lĩnh vực, đề tài nghiên cứu.
737
+
738
+ a) Mỗi NCS phải hoàn thành tối thiểu 8 TC tương ứng 3-4 học phần tiến sĩ.
739
+
740
+ b) NCS phải thực hiện quy trình đăng ký học từ tài khoản học tập trong thời hạn
741
+ 4
742
+
743
+ tuần đầu của học kỳ. Học phần tiến sĩ được tổ chức giảng dạy cho lớp có 5 NCS
744
+ trở lên;
745
+
746
+ trong trường hợp dưới 5 NCS, học phần được thực hiện dưới hình thức hướng dẫn,
747
+ làm đồ
748
+
749
+ án, khoá luận hoặc tiểu luận để thay thế giờ lên lớp.
750
+
751
+ 3. NCS phải hoàn thành tất cả các học phần bổ sung và các học phần tiến sĩ đạt
752
+ từ
753
+
754
+ điểm C trở lên theo yêu cầu của chương trình trong vòng 2 năm kể từ khi có quyết
755
+ định
756
+
757
+ công nhận NCS. Trong trường hợp quá thời hạn 2 năm nhưng không thể hoàn thành,
758
+ NCS
759
+
760
+ có thể đề nghị xin gia hạn thời gian thực hiện trong khoảng thời gian 6 tháng
761
+ kế tiếp; quá
762
+
763
+ thời hạn trên vẫn không thể hoàn thành thì bị xem xét cho thôi học.
764
+
765
+
766
+ '
767
+ pipeline_tag: sentence-similarity
768
+ library_name: sentence-transformers
769
+ metrics:
770
+ - cosine_accuracy@1
771
+ - cosine_accuracy@3
772
+ - cosine_accuracy@5
773
+ - cosine_accuracy@10
774
+ - cosine_precision@1
775
+ - cosine_precision@3
776
+ - cosine_precision@5
777
+ - cosine_precision@10
778
+ - cosine_recall@1
779
+ - cosine_recall@3
780
+ - cosine_recall@5
781
+ - cosine_recall@10
782
+ - cosine_ndcg@10
783
+ - cosine_mrr@10
784
+ - cosine_map@100
785
+ model-index:
786
+ - name: SentenceTransformer based on sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
787
+ results:
788
+ - task:
789
+ type: information-retrieval
790
+ name: Information Retrieval
791
+ dataset:
792
+ name: paraphrase multilingual MiniLM L12 v2 251218
793
+ type: paraphrase-multilingual-MiniLM-L12-v2-251218
794
+ metrics:
795
+ - type: cosine_accuracy@1
796
+ value: 0.7837837837837838
797
+ name: Cosine Accuracy@1
798
+ - type: cosine_accuracy@3
799
+ value: 0.9324324324324325
800
+ name: Cosine Accuracy@3
801
+ - type: cosine_accuracy@5
802
+ value: 0.972972972972973
803
+ name: Cosine Accuracy@5
804
+ - type: cosine_accuracy@10
805
+ value: 1.0
806
+ name: Cosine Accuracy@10
807
+ - type: cosine_precision@1
808
+ value: 0.7837837837837838
809
+ name: Cosine Precision@1
810
+ - type: cosine_precision@3
811
+ value: 0.6936936936936936
812
+ name: Cosine Precision@3
813
+ - type: cosine_precision@5
814
+ value: 0.6378378378378378
815
+ name: Cosine Precision@5
816
+ - type: cosine_precision@10
817
+ value: 0.49459459459459454
818
+ name: Cosine Precision@10
819
+ - type: cosine_recall@1
820
+ value: 0.20849621474621474
821
+ name: Cosine Recall@1
822
+ - type: cosine_recall@3
823
+ value: 0.4308689433689433
824
+ name: Cosine Recall@3
825
+ - type: cosine_recall@5
826
+ value: 0.5757437194937194
827
+ name: Cosine Recall@5
828
+ - type: cosine_recall@10
829
+ value: 0.7718322405822405
830
+ name: Cosine Recall@10
831
+ - type: cosine_ndcg@10
832
+ value: 0.8034889708972982
833
+ name: Cosine Ndcg@10
834
+ - type: cosine_mrr@10
835
+ value: 0.856418918918919
836
+ name: Cosine Mrr@10
837
+ - type: cosine_map@100
838
+ value: 0.7325245230972391
839
+ name: Cosine Map@100
840
+ - type: cosine_accuracy@1
841
+ value: 0.8990825688073395
842
+ name: Cosine Accuracy@1
843
+ - type: cosine_accuracy@3
844
+ value: 0.9357798165137615
845
+ name: Cosine Accuracy@3
846
+ - type: cosine_accuracy@5
847
+ value: 0.944954128440367
848
+ name: Cosine Accuracy@5
849
+ - type: cosine_accuracy@10
850
+ value: 0.9724770642201835
851
+ name: Cosine Accuracy@10
852
+ - type: cosine_precision@1
853
+ value: 0.8990825688073395
854
+ name: Cosine Precision@1
855
+ - type: cosine_precision@3
856
+ value: 0.7553516819571865
857
+ name: Cosine Precision@3
858
+ - type: cosine_precision@5
859
+ value: 0.6458715596330274
860
+ name: Cosine Precision@5
861
+ - type: cosine_precision@10
862
+ value: 0.5009174311926605
863
+ name: Cosine Precision@10
864
+ - type: cosine_recall@1
865
+ value: 0.217371880887659
866
+ name: Cosine Recall@1
867
+ - type: cosine_recall@3
868
+ value: 0.4287293921383023
869
+ name: Cosine Recall@3
870
+ - type: cosine_recall@5
871
+ value: 0.5400064792259527
872
+ name: Cosine Recall@5
873
+ - type: cosine_recall@10
874
+ value: 0.7255591336594405
875
+ name: Cosine Recall@10
876
+ - type: cosine_ndcg@10
877
+ value: 0.8116083858494341
878
+ name: Cosine Ndcg@10
879
+ - type: cosine_mrr@10
880
+ value: 0.918960244648318
881
+ name: Cosine Mrr@10
882
+ - type: cosine_map@100
883
+ value: 0.7575593697819203
884
+ name: Cosine Map@100
885
+ ---
886
+
887
+ # SentenceTransformer based on sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
888
+
889
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2). It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
890
+
891
+ ## Model Details
892
+
893
+ ### Model Description
894
+ - **Model Type:** Sentence Transformer
895
+ - **Base model:** [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2) <!-- at revision 86741b4e3f5cb7765a600d3a3d55a0f6a6cb443d -->
896
+ - **Maximum Sequence Length:** 128 tokens
897
+ - **Output Dimensionality:** 384 dimensions
898
+ - **Similarity Function:** Cosine Similarity
899
+ <!-- - **Training Dataset:** Unknown -->
900
+ <!-- - **Language:** Unknown -->
901
+ <!-- - **License:** Unknown -->
902
+
903
+ ### Model Sources
904
+
905
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
906
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/huggingface/sentence-transformers)
907
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
908
+
909
+ ### Full Model Architecture
910
+
911
+ ```
912
+ SentenceTransformer(
913
+ (0): Transformer({'max_seq_length': 128, 'do_lower_case': False, 'architecture': 'BertModel'})
914
+ (1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
915
+ )
916
+ ```
917
+
918
+ ## Usage
919
+
920
+ ### Direct Usage (Sentence Transformers)
921
+
922
+ First install the Sentence Transformers library:
923
+
924
+ ```bash
925
+ pip install -U sentence-transformers
926
+ ```
927
+
928
+ Then you can load this model and run inference.
929
+ ```python
930
+ from sentence_transformers import SentenceTransformer
931
+
932
+ # Download from the 🤗 Hub
933
+ model = SentenceTransformer("ntAnh-dev/paraphrase-multilingual-MiniLM-L12-v2-bk-quyche")
934
+ # Run inference
935
+ sentences = [
936
+ 'Sinh viên khi đăng ký học phần thì được gì?',
937
+ 'Quy chế đào tạo đại học bách khoa Hà Nội 2025\nCHƯƠNG V\nĐÀO TẠO TIẾN SĨ\nĐiều 38. Học phần bổ sung và học phần tiến sĩ\n1. Các học phần bổ sung nhằm hỗ trợ NCS có đủ kiến thức, trình độ chuyên môn để\nthực hiện đề tài nghiên cứu.\na) Đối với NCS đã có bằng thạc sĩ: khối lượng kiến thức cần phải học bổ sung được\nxác định căn cứ vào các học phần đã tích lũy ở trình độ thạc sĩ, kiến thức cần cập nhật, bổ\nsung và yêu cầu của lĩnh vực, đề tài nghiên cứu. Khối lượng kiến thức tối thiểu 4 TC tương\nứng với 2 học phần.\nb) Đối với NCS chưa có bằng thạc sĩ: các học phần bổ sung bao gồm toàn bộ học\nphần của CTĐT thạc sĩ theo định hướng nghiên cứu thuộc ngành tương ứng trừ luận văn\nthạc sĩ.\nc) NCS đăng ký các học phần bổ sung thuộc chương trình (đại học, thạc sĩ) nào thì sẽ\nhọc theo lớp học phần thuộc chương trình đó.\n2. Các học phần tiến sĩ nhằm nâng cao trình độ lý thuyết, cập nhật các kiến thức mới\nnhất của lĩnh vực chuyên môn, phương pháp nghiên cứu và khả năng ứng dụng các phương\npháp nghiên cứu trong lĩnh vực, đề tài nghiên cứu.\na) Mỗi NCS phải hoàn thành tối thiểu 8 TC tương ứng 3-4 học phần tiến sĩ.\nb) NCS phải thực hiện quy trình đăng ký học từ tài khoản học tập trong thời hạn 4\ntuần đầu của học kỳ. Học phần tiến sĩ được tổ chức giảng dạy cho lớp có 5 NCS trở lên;\ntrong trường hợp dưới 5 NCS, học phần được thực hiện dưới hình thức hướng dẫn, làm đồ\nán, khoá luận hoặc tiểu luận để thay thế giờ lên lớp.\n3. NCS phải hoàn thành tất cả các học phần bổ sung và các học phần tiến sĩ đạt từ\nđiểm C trở lên theo yêu cầu của chương trình trong vòng 2 năm kể từ khi có quyết định\ncông nhận NCS. Trong trường hợp quá thời hạn 2 năm nhưng không thể hoàn thành, NCS\ncó thể đề nghị xin gia hạn thời gian thực hiện trong khoảng thời gian 6 tháng kế tiếp; quá\nthời hạn trên vẫn không thể hoàn thành thì bị xem xét cho thôi học.\n\n',
938
+ 'Quy chế Công tác sinh viên Đại học Bách Khoa Hà Nội\nChương III NỘI DUNG CÔNG TÁC SINH VIÊN\nĐiều 8. Quản lý thông tin sinh viên\n2. Hồ sơ quản lý quá trình học tập, rèn luyện của sinh viên gồm:\na) Kết quả học tập (điểm quá trình, điểm kết thúc học phần, kết quả thi hoặc bảo\nvệ đồ án tốt nghiệp/khoá luận tốt nghiệp) và kết quả rèn luyện (điểm rèn luyện theo\nhọc kỳ, năm học, khoá học);\nb) Kết quả các hoạt động xã hội đã tham gia trong từng học kỳ, năm học;\nc) Hình thức khen thưởng (nếu có) mà sinh viên đạt được trong học tập, nghiên\ncứu khoa học, hoạt động phong trào, đoàn thể;\nd) Hình thức kỷ luật (nếu có);\nđ) Thông tin thay đổi (nếu có) do chuyển chương trình đào tạo, chuyển ngành\nhọc, chuyển trường, nghỉ học có thời hạn, thôi học, tốt nghiệp;\ne) Địa chỉ nơi cư trú;\ng) Tình trạng đóng học phí;\nh) Thông tin về việc tham gia bảo hiểm y tế;\ni) Thông tin kết quả khám sức khỏe cho sinh viên do Đại học tổ chức;\nk) Các học bổng đã được nhận.\n',
939
+ ]
940
+ embeddings = model.encode(sentences)
941
+ print(embeddings.shape)
942
+ # [3, 384]
943
+
944
+ # Get the similarity scores for the embeddings
945
+ similarities = model.similarity(embeddings, embeddings)
946
+ print(similarities)
947
+ # tensor([[ 1.0000, 0.3737, 0.1972],
948
+ # [ 0.3737, 1.0000, -0.0715],
949
+ # [ 0.1972, -0.0715, 1.0000]])
950
+ ```
951
+
952
+ <!--
953
+ ### Direct Usage (Transformers)
954
+
955
+ <details><summary>Click to see the direct usage in Transformers</summary>
956
+
957
+ </details>
958
+ -->
959
+
960
+ <!--
961
+ ### Downstream Usage (Sentence Transformers)
962
+
963
+ You can finetune this model on your own dataset.
964
+
965
+ <details><summary>Click to expand</summary>
966
+
967
+ </details>
968
+ -->
969
+
970
+ <!--
971
+ ### Out-of-Scope Use
972
+
973
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
974
+ -->
975
+
976
+ ## Evaluation
977
+
978
+ ### Metrics
979
+
980
+ #### Information Retrieval
981
+
982
+ * Dataset: `paraphrase-multilingual-MiniLM-L12-v2-251218`
983
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
984
+
985
+ | Metric | Value |
986
+ |:--------------------|:-----------|
987
+ | cosine_accuracy@1 | 0.7838 |
988
+ | cosine_accuracy@3 | 0.9324 |
989
+ | cosine_accuracy@5 | 0.973 |
990
+ | cosine_accuracy@10 | 1.0 |
991
+ | cosine_precision@1 | 0.7838 |
992
+ | cosine_precision@3 | 0.6937 |
993
+ | cosine_precision@5 | 0.6378 |
994
+ | cosine_precision@10 | 0.4946 |
995
+ | cosine_recall@1 | 0.2085 |
996
+ | cosine_recall@3 | 0.4309 |
997
+ | cosine_recall@5 | 0.5757 |
998
+ | cosine_recall@10 | 0.7718 |
999
+ | **cosine_ndcg@10** | **0.8035** |
1000
+ | cosine_mrr@10 | 0.8564 |
1001
+ | cosine_map@100 | 0.7325 |
1002
+
1003
+ #### Information Retrieval
1004
+
1005
+ * Dataset: `paraphrase-multilingual-MiniLM-L12-v2-251218`
1006
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
1007
+
1008
+ | Metric | Value |
1009
+ |:--------------------|:-----------|
1010
+ | cosine_accuracy@1 | 0.8991 |
1011
+ | cosine_accuracy@3 | 0.9358 |
1012
+ | cosine_accuracy@5 | 0.945 |
1013
+ | cosine_accuracy@10 | 0.9725 |
1014
+ | cosine_precision@1 | 0.8991 |
1015
+ | cosine_precision@3 | 0.7554 |
1016
+ | cosine_precision@5 | 0.6459 |
1017
+ | cosine_precision@10 | 0.5009 |
1018
+ | cosine_recall@1 | 0.2174 |
1019
+ | cosine_recall@3 | 0.4287 |
1020
+ | cosine_recall@5 | 0.54 |
1021
+ | cosine_recall@10 | 0.7256 |
1022
+ | **cosine_ndcg@10** | **0.8116** |
1023
+ | cosine_mrr@10 | 0.919 |
1024
+ | cosine_map@100 | 0.7576 |
1025
+
1026
+ <!--
1027
+ ## Bias, Risks and Limitations
1028
+
1029
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
1030
+ -->
1031
+
1032
+ <!--
1033
+ ### Recommendations
1034
+
1035
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
1036
+ -->
1037
+
1038
+ ## Training Details
1039
+
1040
+ ### Training Dataset
1041
+
1042
+ #### Unnamed Dataset
1043
+
1044
+ * Size: 4,485 training samples
1045
+ * Columns: <code>anchor</code> and <code>positive</code>
1046
+ * Approximate statistics based on the first 1000 samples:
1047
+ | | anchor | positive |
1048
+ |:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
1049
+ | type | string | string |
1050
+ | details | <ul><li>min: 11 tokens</li><li>mean: 22.66 tokens</li><li>max: 46 tokens</li></ul> | <ul><li>min: 128 tokens</li><li>mean: 128.0 tokens</li><li>max: 128 tokens</li></ul> |
1051
+ * Samples:
1052
+ | anchor | positive |
1053
+ |:-------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
1054
+ | <code>Tại trường có bao nhiêu loại học bổng KKHT(khuyến khích học tập)?</code> | <code>Quy định xét cấp học bổng khuyến khích học tập tại Đại học Bách khoa Hà Nội<br>Điều 2. Các quy định chung<br>2. Học bổng KKHT nhằm khuyến khích sinh viên nâng cao thành tích học tập và<br>rèn luyện tại ĐHBK Hà Nội.<br>3. Quỹ học bổng KKHT hình thành từ nguồn học phí và bằng 8% (tám phần<br>trăm) học phí của học kỳ lấy điểm xét cấp học bổng.<br>4. Học bổng KKHT có 3 mức:<br>a) Học bổng loại khá (loại C): Bằng tổng học phí của tất cả các học phần tính<br>điểm trung bình học kỳ (GPA).<br>b) Học bổng loại giỏi (loại B): Bằng 1,2 lần mức học bổng loại khá.<br>c) Học bổng loại xuất sắc (loại A): Bằng 1,5 lần mức học bổng loại khá.<br>Điều 3. Tiêu chuẩn xét cấp học bổng<br>1. Học bổng loại C: GPA ≥ 2,5 và điểm rèn luyện học kỳ ≥ 65 điểm.<br>2. Học bổng loại B: GPA ≥ 3,2 và điểm rèn luyện học kỳ ≥ 80 điểm.<br>3. Học bổng loại A: GPA ≥ 3,6 và điểm rèn luyện học kỳ ≥ 90 điểm.<br>Điều 4. Nguyên tắc xét cấp học bổng<br>1. Sử dụng kết quả học tập và rèn luyện của học kỳ liền trước để xét cấp học<br>bổng cho học kỳ sau.<br>2. Học bổng được xét theo ...</code> |
1055
+ | <code>Tại trường có bao nhiêu loại học bổng KKHT(khuyến khích học tập)?</code> | <code>Quy định xét cấp học bổng khuyến khích học tập tại Đại học Bách khoa Hà Nội<br>Điều 1. Phạm vi điều chỉnh và đối tượng áp dụng<br>1. Văn bản này quy định về nguyên tắc, tiêu chuẩn xét duyệt và cấp học bổng cho<br>sinh viên đại học hình thức đào tạo chính quy tại Đại học Bách khoa Hà Nội (sau đây<br>viết tắt là ĐHBK Hà N ội), căn cứ các quy định liên quan tại Nghị định số<br>84/2020/NĐ-CP ngày 17/7/2020 của Chính phủ và Quy chế Quản lý tài chính của Đại<br>học Bách khoa Hà Nội được ban hành theo Nghị quyết số 20/NQ-ĐHBK ngày<br>16/3/2023 của Hội đồng Đại học, Đại học Bách khoa Hà Nội.<br>2. Quy định này áp dụng đối với sinh viên đại học hình thức đào tạo chính quy<br>văn bằng thứ nhất của ĐHBK Hà Nội.<br>Điều 2. Các quy định chung<br>1. Học bổng khuyến khích học tập (KKHT) cấp cho các sinh viên được lựa chọn<br>bởi Hội đồng xét cấp học bổng ĐHBK Hà Nội theo từng học kỳ chính của năm học ,<br>căn cứ vào thành tích học tập và rèn luyện của sinh viên trong học kỳ chính liền trước<br>đó.<br></code> |
1056
+ | <code>trường gồm mấy loại học bổng khuyến khích học tập ?</code> | <code>Quy định xét cấp học bổng khuyến khích học tập tại Đại học Bách khoa Hà Nội<br>Điều 4. Nguyên tắc xét cấp học bổng<br>3. Không xét cấp học bổng đối với sinh viên thuộc một trong các trường hợp sau:<br>a) Chịu hình thức kỷ luật từ mức khiển trách trở lên tại thời điểm xét học bổng;<br>b) Đăng ký học ít hơn 1 5 tín chỉ (kể cả các học phần không tính điểm GPA) tại<br>học kỳ lấy điểm xét, cấp học bổng, ngoại trừ học kỳ 1 năm học thứ nhất;<br>c) Đăng ký học ít hơn 6 tín chỉ (kể cả các học phần không tính điểm GPA) tại<br>học kỳ cấp học bổng;<br>d) Học quá thời gian theo kế hoạch học tập chuẩn của chương trình đào tạo;<br>đ) Học chương trình đào tạo do trường đối tác nước ngoài cấp một văn bằng tốt<br>nghiệp duy nhất;<br>Điều 5. Thời gian công bố kết quả xét duyệt và cấp học bổng<br>1. Danh sách sinh viên được cấp học bổng và mức đ iểm chuẩn để đạt học bổng<br>loại A, B, C theo khóa, ngành đào tạo tương ứng sẽ được công bố trên cổng thông tin<br>sinh viên: ctt.hust.edu.vn, chậm nhất vào tuần học thứ 10 của học kỳ cấp học bổng.<br></code> |
1057
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
1058
+ ```json
1059
+ {
1060
+ "scale": 20.0,
1061
+ "similarity_fct": "cos_sim",
1062
+ "gather_across_devices": false
1063
+ }
1064
+ ```
1065
+
1066
+ ### Evaluation Dataset
1067
+
1068
+ #### Unnamed Dataset
1069
+
1070
+ * Size: 597 evaluation samples
1071
+ * Columns: <code>anchor</code> and <code>positive</code>
1072
+ * Approximate statistics based on the first 597 samples:
1073
+ | | anchor | positive |
1074
+ |:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
1075
+ | type | string | string |
1076
+ | details | <ul><li>min: 10 tokens</li><li>mean: 23.93 tokens</li><li>max: 55 tokens</li></ul> | <ul><li>min: 128 tokens</li><li>mean: 128.0 tokens</li><li>max: 128 tokens</li></ul> |
1077
+ * Samples:
1078
+ | anchor | positive |
1079
+ |:-------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
1080
+ | <code>Quy định, quy chế về học tập thì sinh viên xem ở trang nào?</code> | <code>Quy chế Công tác sinh viên Đại học Bách Khoa Hà Nội<br>Chương III NỘI DUNG CÔNG TÁC SINH VIÊN<br>Điều 8. Quản lý thông tin sinh viên<br>2. Hồ sơ quản lý quá trình học tập, rèn luyện của sinh viên gồm:<br>a) Kết quả học tập (điểm quá trình, điểm kết thúc học phần, kết qu�� thi hoặc bảo<br>vệ đồ án tốt nghiệp/khoá luận tốt nghiệp) và kết quả rèn luyện (điểm rèn luyện theo<br>học kỳ, năm học, khoá học);<br>b) Kết quả các hoạt động xã hội đã tham gia trong từng học kỳ, năm học;<br>c) Hình thức khen thưởng (nếu có) mà sinh viên đạt được trong học tập, nghiên<br>cứu khoa học, hoạt động phong trào, đoàn thể;<br>d) Hình thức kỷ luật (nếu có);<br>đ) Thông tin thay đổi (nếu có) do chuyển chương trình đào tạo, chuyển ngành<br>học, chuyển trường, nghỉ học có thời hạn, thôi học, tốt nghiệp;<br>e) Địa chỉ nơi cư trú;<br>g) Tình trạng đóng học phí;<br>h) Thông tin về việc tham gia bảo hiểm y tế;<br>i) Thông tin kết quả khám sức khỏe cho sinh viên do Đại học tổ chức;<br>k) Các học bổng đã được nhận.<br></code> |
1081
+ | <code>Quy định, quy chế về học tập thì sinh viên xem ở trang nào?</code> | <code>Quy chế Công tác sinh viên Đại học Bách Khoa Hà Nội<br>Chương I NHỮNG QUY ĐỊNH CHUNG<br>Điều 3. Vị trí của sinh viên trong Đại học Bách khoa Hà Nội<br>Sinh viên là trung tâm các hoạt động giáo dục, đào tạo, nghiên cứu, khoa học<br>công nghệ, đổi mới sáng tạo và khởi nghiệp tại Đại học Bách khoa Hà Nội, được hỗ<br>trợ và tạo điều kiện tốt nhất về vật chất, tinh thần để phát triển toàn diện cả về đạo đức,<br>tri thức, phẩm chất, năng lực, tầm nhìn, kỹ năng và sức khỏe để phục vụ xã hội và đất<br>nước.<br>Điều 4. Từ viết tắt<br>1. Đại học: Đại học Bách khoa Hà Nội;<br>2. Đơn vị quản ngành: Trường/Khoa quản ngành;<br>3. NCKH: nghiên cứu khoa học;<br>4. QLLSV: quản lý lớp sinh viên.<br>Chương II TRÁCH NHIỆM VÀ QUYỀN LỢI CỦA SINH VIÊN<br>Điều 5. Trách nhiệm của sinh viên<br>1. Chấp hành nghiêm chủ trương, đường lối của Đảng, chính sách pháp luật của<br>Nhà nước và các quy định của Đại học.<br>2. Học tập, rèn luyện theo chương trình, kế hoạch của Đại học; chủ động, tích<br>cực tự học tập, NCKH và rèn luyện đạo đức, lối sống.<br></code> |
1082
+ | <code>Quy định, quy chế về học tập thì sinh viên xem ở trang nào?</code> | <code>Quy chế Công tác sinh viên Đại học Bách Khoa Hà Nội<br>Chương IV ĐÁNH GIÁ KẾT QUẢ RÈN LUYỆN SINH VIÊN<br>Điều 22. Nội dung, tiêu chí và thời gian đánh giá<br>1. Nội dung đánh giá gồm:<br>a) Ý thức tham gia học tập;<br>b) Ý thức chấp hành nội quy, quy chế, quy định của Đại học;<br>c) Ý thức tham gia các hoạt động chính trị, xã hội, văn hoá, văn nghệ, thể thao,<br>phòng chống tội phạm và các tệ nạn xã hội;<br>d) Ý thức công dân trong quan hệ với cộng đồng;<br>đ) Ý thức và kết quả tham gia công tác cán bộ lớp, các đoàn thể, tổ chức khác<br>trong Đại học hoặc các thành tích đặc biệt trong học tập và rèn luyện.<br>2. Kết quả rèn luyện của sinh viên được đánh giá theo học kỳ, năm học và khóa học.<br>3. Tiêu chí và thang, khung điểm đánh giá: hằng năm Giám đốc đại học ban hành<br>quy định chi tiết về tiêu chí và thang, khung điểm cho từng nội dung đánh giá.<br>Điều 23. Quy trình đánh giá<br>1. Các đơn vị liên quan được phân cấp tổ chức hoạt động công bố công khai kế<br>hoạch tổ chức các hoạt động cho sinh viên trên cổng thông tin sinh viên...</code> |
1083
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
1084
+ ```json
1085
+ {
1086
+ "scale": 20.0,
1087
+ "similarity_fct": "cos_sim",
1088
+ "gather_across_devices": false
1089
+ }
1090
+ ```
1091
+
1092
+ ### Training Hyperparameters
1093
+ #### Non-Default Hyperparameters
1094
+
1095
+ - `eval_strategy`: steps
1096
+ - `per_device_train_batch_size`: 16
1097
+ - `per_device_eval_batch_size`: 16
1098
+ - `learning_rate`: 2e-05
1099
+ - `num_train_epochs`: 30
1100
+ - `warmup_ratio`: 0.1
1101
+ - `fp16`: True
1102
+ - `batch_sampler`: no_duplicates
1103
+
1104
+ #### All Hyperparameters
1105
+ <details><summary>Click to expand</summary>
1106
+
1107
+ - `overwrite_output_dir`: False
1108
+ - `do_predict`: False
1109
+ - `eval_strategy`: steps
1110
+ - `prediction_loss_only`: True
1111
+ - `per_device_train_batch_size`: 16
1112
+ - `per_device_eval_batch_size`: 16
1113
+ - `per_gpu_train_batch_size`: None
1114
+ - `per_gpu_eval_batch_size`: None
1115
+ - `gradient_accumulation_steps`: 1
1116
+ - `eval_accumulation_steps`: None
1117
+ - `torch_empty_cache_steps`: None
1118
+ - `learning_rate`: 2e-05
1119
+ - `weight_decay`: 0.0
1120
+ - `adam_beta1`: 0.9
1121
+ - `adam_beta2`: 0.999
1122
+ - `adam_epsilon`: 1e-08
1123
+ - `max_grad_norm`: 1.0
1124
+ - `num_train_epochs`: 30
1125
+ - `max_steps`: -1
1126
+ - `lr_scheduler_type`: linear
1127
+ - `lr_scheduler_kwargs`: {}
1128
+ - `warmup_ratio`: 0.1
1129
+ - `warmup_steps`: 0
1130
+ - `log_level`: passive
1131
+ - `log_level_replica`: warning
1132
+ - `log_on_each_node`: True
1133
+ - `logging_nan_inf_filter`: True
1134
+ - `save_safetensors`: True
1135
+ - `save_on_each_node`: False
1136
+ - `save_only_model`: False
1137
+ - `restore_callback_states_from_checkpoint`: False
1138
+ - `no_cuda`: False
1139
+ - `use_cpu`: False
1140
+ - `use_mps_device`: False
1141
+ - `seed`: 42
1142
+ - `data_seed`: None
1143
+ - `jit_mode_eval`: False
1144
+ - `bf16`: False
1145
+ - `fp16`: True
1146
+ - `fp16_opt_level`: O1
1147
+ - `half_precision_backend`: auto
1148
+ - `bf16_full_eval`: False
1149
+ - `fp16_full_eval`: False
1150
+ - `tf32`: None
1151
+ - `local_rank`: 0
1152
+ - `ddp_backend`: None
1153
+ - `tpu_num_cores`: None
1154
+ - `tpu_metrics_debug`: False
1155
+ - `debug`: []
1156
+ - `dataloader_drop_last`: False
1157
+ - `dataloader_num_workers`: 0
1158
+ - `dataloader_prefetch_factor`: None
1159
+ - `past_index`: -1
1160
+ - `disable_tqdm`: False
1161
+ - `remove_unused_columns`: True
1162
+ - `label_names`: None
1163
+ - `load_best_model_at_end`: False
1164
+ - `ignore_data_skip`: False
1165
+ - `fsdp`: []
1166
+ - `fsdp_min_num_params`: 0
1167
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
1168
+ - `fsdp_transformer_layer_cls_to_wrap`: None
1169
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
1170
+ - `parallelism_config`: None
1171
+ - `deepspeed`: None
1172
+ - `label_smoothing_factor`: 0.0
1173
+ - `optim`: adamw_torch_fused
1174
+ - `optim_args`: None
1175
+ - `adafactor`: False
1176
+ - `group_by_length`: False
1177
+ - `length_column_name`: length
1178
+ - `project`: huggingface
1179
+ - `trackio_space_id`: trackio
1180
+ - `ddp_find_unused_parameters`: None
1181
+ - `ddp_bucket_cap_mb`: None
1182
+ - `ddp_broadcast_buffers`: False
1183
+ - `dataloader_pin_memory`: True
1184
+ - `dataloader_persistent_workers`: False
1185
+ - `skip_memory_metrics`: True
1186
+ - `use_legacy_prediction_loop`: False
1187
+ - `push_to_hub`: False
1188
+ - `resume_from_checkpoint`: None
1189
+ - `hub_model_id`: None
1190
+ - `hub_strategy`: every_save
1191
+ - `hub_private_repo`: None
1192
+ - `hub_always_push`: False
1193
+ - `hub_revision`: None
1194
+ - `gradient_checkpointing`: False
1195
+ - `gradient_checkpointing_kwargs`: None
1196
+ - `include_inputs_for_metrics`: False
1197
+ - `include_for_metrics`: []
1198
+ - `eval_do_concat_batches`: True
1199
+ - `fp16_backend`: auto
1200
+ - `push_to_hub_model_id`: None
1201
+ - `push_to_hub_organization`: None
1202
+ - `mp_parameters`:
1203
+ - `auto_find_batch_size`: False
1204
+ - `full_determinism`: False
1205
+ - `torchdynamo`: None
1206
+ - `ray_scope`: last
1207
+ - `ddp_timeout`: 1800
1208
+ - `torch_compile`: False
1209
+ - `torch_compile_backend`: None
1210
+ - `torch_compile_mode`: None
1211
+ - `include_tokens_per_second`: False
1212
+ - `include_num_input_tokens_seen`: no
1213
+ - `neftune_noise_alpha`: None
1214
+ - `optim_target_modules`: None
1215
+ - `batch_eval_metrics`: False
1216
+ - `eval_on_start`: False
1217
+ - `use_liger_kernel`: False
1218
+ - `liger_kernel_config`: None
1219
+ - `eval_use_gather_object`: False
1220
+ - `average_tokens_across_devices`: True
1221
+ - `prompts`: None
1222
+ - `batch_sampler`: no_duplicates
1223
+ - `multi_dataset_batch_sampler`: proportional
1224
+ - `router_mapping`: {}
1225
+ - `learning_rate_mapping`: {}
1226
+
1227
+ </details>
1228
+
1229
+ ### Training Logs
1230
+ | Epoch | Step | Training Loss | Validation Loss | paraphrase-multilingual-MiniLM-L12-v2-251218_cosine_ndcg@10 |
1231
+ |:-------:|:----:|:-------------:|:---------------:|:-----------------------------------------------------------:|
1232
+ | -1 | -1 | - | - | 0.5888 |
1233
+ | 0.3559 | 100 | 1.9738 | 1.8826 | 0.6336 |
1234
+ | 0.7117 | 200 | 1.5412 | 1.7519 | 0.6931 |
1235
+ | 1.0676 | 300 | 1.3578 | 1.6506 | 0.7402 |
1236
+ | 1.4235 | 400 | 1.2408 | 1.6552 | 0.7387 |
1237
+ | 1.7794 | 500 | 1.1665 | 1.5786 | 0.7650 |
1238
+ | 2.1352 | 600 | 1.0873 | 1.5021 | 0.7725 |
1239
+ | 2.4911 | 700 | 1.0551 | 1.5724 | 0.7614 |
1240
+ | 2.8470 | 800 | 1.0584 | 1.4993 | 0.7910 |
1241
+ | 3.2028 | 900 | 0.9829 | 1.5282 | 0.7861 |
1242
+ | 3.5587 | 1000 | 0.9766 | 1.5346 | 0.7957 |
1243
+ | 3.9146 | 1100 | 1.0012 | 1.5599 | 0.7393 |
1244
+ | 4.2705 | 1200 | 0.9527 | 1.5495 | 0.7834 |
1245
+ | 4.6263 | 1300 | 0.9567 | 1.5561 | 0.7618 |
1246
+ | 4.9822 | 1400 | 0.9442 | 1.5282 | 0.7664 |
1247
+ | 5.3381 | 1500 | 0.8543 | 1.5997 | 0.7987 |
1248
+ | 5.6940 | 1600 | 0.9086 | 1.5722 | 0.7471 |
1249
+ | 6.0498 | 1700 | 0.9049 | 1.5572 | 0.7464 |
1250
+ | 6.4057 | 1800 | 0.861 | 1.5593 | 0.7424 |
1251
+ | 6.7616 | 1900 | 0.8544 | 1.6033 | 0.7750 |
1252
+ | 7.1174 | 2000 | 0.88 | 1.5399 | 0.7711 |
1253
+ | 7.4733 | 2100 | 0.7994 | 1.5754 | 0.7445 |
1254
+ | 7.8292 | 2200 | 0.8917 | 1.5410 | 0.7739 |
1255
+ | 8.1851 | 2300 | 0.8223 | 1.6651 | 0.7746 |
1256
+ | 8.5409 | 2400 | 0.8083 | 1.5392 | 0.7786 |
1257
+ | 8.8968 | 2500 | 0.8465 | 1.5854 | 0.7616 |
1258
+ | 9.2527 | 2600 | 0.791 | 1.6248 | 0.7874 |
1259
+ | 9.6085 | 2700 | 0.7658 | 1.6303 | 0.7799 |
1260
+ | 9.9644 | 2800 | 0.8345 | 1.5883 | 0.7734 |
1261
+ | 10.3203 | 2900 | 0.7768 | 1.5622 | 0.7883 |
1262
+ | 10.6762 | 3000 | 0.7973 | 1.5702 | 0.7637 |
1263
+ | 11.0320 | 3100 | 0.8093 | 1.5512 | 0.7833 |
1264
+ | 11.3879 | 3200 | 0.7456 | 1.5918 | 0.7738 |
1265
+ | 11.7438 | 3300 | 0.8042 | 1.5712 | 0.7677 |
1266
+ | 12.0996 | 3400 | 0.7686 | 1.6072 | 0.7540 |
1267
+ | 12.4555 | 3500 | 0.8091 | 1.5431 | 0.7751 |
1268
+ | 12.8114 | 3600 | 0.7492 | 1.5707 | 0.7585 |
1269
+ | 13.1673 | 3700 | 0.7522 | 1.6303 | 0.7955 |
1270
+ | 13.5231 | 3800 | 0.7287 | 1.6398 | 0.7775 |
1271
+ | 13.8790 | 3900 | 0.7579 | 1.5936 | 0.7589 |
1272
+ | 14.2349 | 4000 | 0.7459 | 1.6094 | 0.7872 |
1273
+ | 14.5907 | 4100 | 0.7687 | 1.5937 | 0.7836 |
1274
+ | 14.9466 | 4200 | 0.7098 | 1.6023 | 0.7943 |
1275
+ | 15.3025 | 4300 | 0.7107 | 1.5996 | 0.7858 |
1276
+ | 15.6584 | 4400 | 0.7041 | 1.6134 | 0.8099 |
1277
+ | 16.0142 | 4500 | 0.7432 | 1.5947 | 0.8015 |
1278
+ | 16.3701 | 4600 | 0.707 | 1.6477 | 0.7868 |
1279
+ | 16.7260 | 4700 | 0.7495 | 1.6026 | 0.7843 |
1280
+ | 17.0819 | 4800 | 0.7294 | 1.6257 | 0.7776 |
1281
+ | 17.4377 | 4900 | 0.682 | 1.6573 | 0.8054 |
1282
+ | 17.7936 | 5000 | 0.7326 | 1.6821 | 0.7938 |
1283
+ | 18.1495 | 5100 | 0.6753 | 1.6687 | 0.7951 |
1284
+ | 18.5053 | 5200 | 0.6649 | 1.6190 | 0.8038 |
1285
+ | 18.8612 | 5300 | 0.7077 | 1.6292 | 0.7932 |
1286
+ | 19.2171 | 5400 | 0.6538 | 1.6576 | 0.7998 |
1287
+ | 19.5730 | 5500 | 0.7191 | 1.6292 | 0.7978 |
1288
+ | 19.9288 | 5600 | 0.714 | 1.6407 | 0.8002 |
1289
+ | 20.2847 | 5700 | 0.6545 | 1.6965 | 0.7895 |
1290
+ | 20.6406 | 5800 | 0.6755 | 1.6884 | 0.7952 |
1291
+ | 20.9964 | 5900 | 0.7138 | 1.6375 | 0.7981 |
1292
+ | 21.3523 | 6000 | 0.6893 | 1.6520 | 0.7980 |
1293
+ | 21.7082 | 6100 | 0.6905 | 1.6350 | 0.8052 |
1294
+ | 22.0641 | 6200 | 0.6822 | 1.6342 | 0.7933 |
1295
+ | 22.4199 | 6300 | 0.6298 | 1.6664 | 0.8044 |
1296
+ | 22.7758 | 6400 | 0.643 | 1.6501 | 0.7984 |
1297
+ | 23.1317 | 6500 | 0.6687 | 1.6730 | 0.7967 |
1298
+ | 23.4875 | 6600 | 0.6801 | 1.6590 | 0.7904 |
1299
+ | 23.8434 | 6700 | 0.6742 | 1.6567 | 0.7959 |
1300
+ | 24.1993 | 6800 | 0.6234 | 1.6965 | 0.8008 |
1301
+ | 24.5552 | 6900 | 0.6402 | 1.6812 | 0.8012 |
1302
+ | 24.9110 | 7000 | 0.7185 | 1.6665 | 0.7989 |
1303
+ | 25.2669 | 7100 | 0.6277 | 1.7008 | 0.8041 |
1304
+ | 25.6228 | 7200 | 0.6156 | 1.6956 | 0.8034 |
1305
+ | 25.9786 | 7300 | 0.6474 | 1.6867 | 0.8059 |
1306
+ | 26.3345 | 7400 | 0.5892 | 1.7106 | 0.8032 |
1307
+ | 26.6904 | 7500 | 0.6629 | 1.7075 | 0.8068 |
1308
+ | 27.0463 | 7600 | 0.6537 | 1.6895 | 0.8011 |
1309
+ | 27.4021 | 7700 | 0.6178 | 1.7006 | 0.8048 |
1310
+ | 27.7580 | 7800 | 0.6545 | 1.6961 | 0.8029 |
1311
+ | 28.1139 | 7900 | 0.6339 | 1.6983 | 0.7980 |
1312
+ | 28.4698 | 8000 | 0.6496 | 1.7020 | 0.7970 |
1313
+ | 28.8256 | 8100 | 0.6199 | 1.6991 | 0.8001 |
1314
+ | 29.1815 | 8200 | 0.613 | 1.7019 | 0.8038 |
1315
+ | 29.5374 | 8300 | 0.6264 | 1.7035 | 0.8035 |
1316
+ | 29.8932 | 8400 | 0.657 | 1.7041 | 0.8035 |
1317
+ | -1 | -1 | - | - | 0.8116 |
1318
+
1319
+
1320
+ ### Framework Versions
1321
+ - Python: 3.12.12
1322
+ - Sentence Transformers: 5.2.0
1323
+ - Transformers: 4.57.3
1324
+ - PyTorch: 2.9.0+cu126
1325
+ - Accelerate: 1.12.0
1326
+ - Datasets: 4.0.0
1327
+ - Tokenizers: 0.22.1
1328
+
1329
+ ## Citation
1330
+
1331
+ ### BibTeX
1332
+
1333
+ #### Sentence Transformers
1334
+ ```bibtex
1335
+ @inproceedings{reimers-2019-sentence-bert,
1336
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
1337
+ author = "Reimers, Nils and Gurevych, Iryna",
1338
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
1339
+ month = "11",
1340
+ year = "2019",
1341
+ publisher = "Association for Computational Linguistics",
1342
+ url = "https://arxiv.org/abs/1908.10084",
1343
+ }
1344
+ ```
1345
+
1346
+ #### MultipleNegativesRankingLoss
1347
+ ```bibtex
1348
+ @misc{henderson2017efficient,
1349
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
1350
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
1351
+ year={2017},
1352
+ eprint={1705.00652},
1353
+ archivePrefix={arXiv},
1354
+ primaryClass={cs.CL}
1355
+ }
1356
+ ```
1357
+
1358
+ <!--
1359
+ ## Glossary
1360
+
1361
+ *Clearly define terms in order to be accessible across audiences.*
1362
+ -->
1363
+
1364
+ <!--
1365
+ ## Model Card Authors
1366
+
1367
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
1368
+ -->
1369
+
1370
+ <!--
1371
+ ## Model Card Contact
1372
+
1373
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
1374
+ -->
config.json ADDED
@@ -0,0 +1,25 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "BertModel"
4
+ ],
5
+ "attention_probs_dropout_prob": 0.1,
6
+ "classifier_dropout": null,
7
+ "dtype": "float32",
8
+ "gradient_checkpointing": false,
9
+ "hidden_act": "gelu",
10
+ "hidden_dropout_prob": 0.1,
11
+ "hidden_size": 384,
12
+ "initializer_range": 0.02,
13
+ "intermediate_size": 1536,
14
+ "layer_norm_eps": 1e-12,
15
+ "max_position_embeddings": 512,
16
+ "model_type": "bert",
17
+ "num_attention_heads": 12,
18
+ "num_hidden_layers": 12,
19
+ "pad_token_id": 0,
20
+ "position_embedding_type": "absolute",
21
+ "transformers_version": "4.57.3",
22
+ "type_vocab_size": 2,
23
+ "use_cache": true,
24
+ "vocab_size": 250037
25
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "5.2.0",
4
+ "transformers": "4.57.3",
5
+ "pytorch": "2.9.0+cu126"
6
+ },
7
+ "model_type": "SentenceTransformer",
8
+ "prompts": {
9
+ "query": "",
10
+ "document": ""
11
+ },
12
+ "default_prompt_name": null,
13
+ "similarity_fn_name": "cosine"
14
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:424b759ac54eacc3cde1fab162dcc6bea7480d1e2d80b9306ff8c74fc61d135e
3
+ size 470637416
modules.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ }
14
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 128,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cad551d5600a84242d0973327029452a1e3672ba6313c2a3c3d69c4310e12719
3
+ size 17082987
tokenizer_config.json ADDED
@@ -0,0 +1,65 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": false,
46
+ "cls_token": "<s>",
47
+ "do_lower_case": true,
48
+ "eos_token": "</s>",
49
+ "extra_special_tokens": {},
50
+ "mask_token": "<mask>",
51
+ "max_length": 128,
52
+ "model_max_length": 128,
53
+ "pad_to_multiple_of": null,
54
+ "pad_token": "<pad>",
55
+ "pad_token_type_id": 0,
56
+ "padding_side": "right",
57
+ "sep_token": "</s>",
58
+ "stride": 0,
59
+ "strip_accents": null,
60
+ "tokenize_chinese_chars": true,
61
+ "tokenizer_class": "BertTokenizer",
62
+ "truncation_side": "right",
63
+ "truncation_strategy": "longest_first",
64
+ "unk_token": "<unk>"
65
+ }
unigram.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:da145b5e7700ae40f16691ec32a0b1fdc1ee3298db22a31ea55f57a966c4a65d
3
+ size 14763260