File size: 38,002 Bytes
66f2181
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
---
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:507152
- loss:CachedMultipleNegativesRankingLoss
base_model: tencent/KaLM-Embedding-Gemma3-12B-2511
widget:
- source_sentence: Nếu một người vi phạm các quy định về vệ sinh nơi công cộng, họ
    sẽ bị xử  như thế nào?
  sentences:
  - '2. Kiểm tra, xác nhận các nội dung liên quan đến công tác quay số mở thưởng bao
    gồm: a) Đối với hình thức quay số mở thưởng bằng lồng cầu: - Kiểm tra, xác nhận
    Hội đồng giám sát xổ số đã thực hiện nhiệm vụ kiểm tra việc khóa máy chủ để đảm
    bảo toàn bộ hệ thống không phát hành được vé ngay sau thời điểm kết thúc thời
    gian phát hành; - Kiểm tra, xác nhận việc tuân thủ quy trình quay số mở thưởng
    được quy định tại Thể lệ quay số mở thưởng đã được công bố công khai và quy định
    tại Thông tư này; - Kiểm tra, xác nhận công ty xổ số điện toán ký xác nhận bảng
    tổng hợp doanh thu; - Kiểm tra, xác nhận việc sao lưu và niêm phong dữ liệu bộ
    số dự thưởng của các kỳ quay số mở thưởng; - Kiểm tra, xác nhận việc xác nhận
    kết quả quay số mở thưởng của Hội đồng giám sát trùng khớp với kết quả quay số
    mở thưởng trên thực tế.'
  - Chương 10. KHEN THƯỞNG  XỬ  CÁC VI PHẠM Điều 52. Khen thưởng.. Địa phương,
    đơn vị,  nhân  thành tích trong công tác bảo vệ sức khoẻ nhân dân được Nhà
    nước khen thưởng vật chất  tinh thần. Thầy thuốc, lương y, dược   nhân viên
    y tế khác  nhiều cống hiến trong sự nghiệp bảo vệ sức khoẻ nhân dân,  trình
    độ nghiệp vụ, chuyên môn kỹ thuật giỏi,  đạo đức, được nhân dân  đồng nghiệp
    tín nhiệm thì được xét tặng danh hiệu cao quý của Nhà nước. Điều 53. Xử  các
    vi phạm. Người nào  những hành vi sau đây thì tuỳ theo mức độ nhẹ hoặc nặng
    sẽ bị xứ  kỷ luật, bị xử  hành chính hoặc bị truy cứu trách nhiệm hình sự.
    1- Vi phạm các quy định về giữ gìn vệ sinh nơi công cộng, phòng  chống dịch,
    bệnh. 2- Vi phạm các quy định về khám bệnh, chữa bệnh, sản xuất thuốc  bán thuốc.
    3- Vi phạm các quy định về vệ sinh lương thực, thực phẩm, vệ sinh lao động 
    các quy định khác của Luật bảo vệ sức khoẻ nhân dân.
  - Điều 4. Mẫu các văn bản ban hành kèm theo Thông  liên tịch 1. Đơn xin hoãn,
    miễn chấp hành án phạt  (Mẫu số 01). 2. Quyết định hoãn chấp hành án phạt 
    (Mẫu số 02). 3. Quyết định hủy Quyết định hoãn chấp hành án phạt  (Mẫu số 03).
    4. Quyết định hủy Quyết định hoãn chấp hành án phạt   áp dụng biện pháp bắt
    buộc chữa bệnh (Mẫu số 04). 5. Quyết định mở phiên họp xem xét miễn chấp hành
    án phạt  (Mẫu số 05). 6. Quyết định về việc xét miễn chấp hành án phạt  (Mẫu
    số 06).
- source_sentence: Trước khi tiến hành nhận dạng, thực nghiệm điều tra, nhận biết
    giọng nói, Điều tra viên phải thông báo cho Kiểm sát viên biết trước bao nhiêu
    giờ?
  sentences:
  - Khoản 1. Việc nhận dạng, thực nghiệm điều tra, nhận biết giọng nói được thực hiện
    theo quy định tại các điều 190, 191, 204  421 của Bộ luật Tố tụng hình sự. Chậm
    nhất 24 giờ trước khi tiến hành, Điều tra viên báo cho Kiểm sát viên biết thời
    gian, địa điểm nhận dạng, thực nghiệm điều tra, nhận biết giọng nói. Kiểm sát
    viên phải  mặt để kiểm sát. Điều tra viên  Kiểm sát viên phối hợp kiểm tra,
    đánh giá kết quả nhận dạng, thực nghiệm điều tra, nhận biết giọng nói để đề ra
    các yêu cầu điều tra tiếp theo. Trường hợp   do khách quan không  mặt để
    kiểm sát trực tiếp thì Kiểm sát viên báo cho Điều tra viên trước khi tiến hành
    02 giờ.
  - 'Khoản 2. Giám định viên, tổ chức được trưng cầu giám định có trách nhiệm như
    sau: a) Giám định và ban hành kết luận giám định trong thời hạn 05 ngày kể từ
    ngày nhận được quyết định trưng cầu giám định. Trường hợp không thể tiến hành
    trong thời hạn thì kịp thời thông báo bằng văn bản để cơ quan trưng cầu giám định
    biết, nêu rõ lý do, thời gian dự kiến ban hành kết luận giám định; b) Gửi kết
    luận giám định cho cơ quan đã trưng cầu giám định trong thời hạn quy định tại
    khoản 2 Điều 213 của Bộ luật Tố tụng hình sự; c) Kịp thời có mặt để thực hiện
    kiểm tra dấu vết, thu mẫu giám định trong trường hợp quy định tại điểm a khoản
    1 Điều này; trường hợp không thể có mặt thì phải thông báo ngay và nêu rõ lý do
    cho Điều tra viên biết; d) Khi tiến hành giám định, nếu thấy nội dung yêu cầu
    giám định chưa rõ ràng thì yêu cầu cơ quan trưng cầu giám định giải thích và bổ
    sung tài liệu. Khi cơ quan trưng cầu đề nghị, Giám định viên kịp thời giải thích
    cụ thể các vấn đề trong kết luận giám định.'
  - 'Điều 19. Hệ thống quay số mở thưởng điện tử 1. Hệ thống quay số mở thưởng điện
    tử bao gồm: a) Thiết bị quay số mở thưởng tự động, bao gồm: Hệ thống phần cứng
    và phần mềm quay số tự động; b) Hệ thống camera, màn hình phục vụ cho việc giám
    sát được thiết bị quay số mở thưởng tự động. 2. Yêu cầu đối với thiết bị quay
    số mở thưởng tự động: a) Có xuất xứ rõ ràng, đảm bảo các tiêu chuẩn và thông số
    kỹ thuật theo đúng thiết kế của nhà sản xuất và được kiểm định bởi công ty kiểm
    định độc lập; b) Vận hành an toàn, ổn định và đảm bảo hoàn toàn ngẫu nhiên, không
    có bất kỳ sự can thiệp nào từ bên ngoài vào kết quả mở thưởng; c) Có ít nhất một
    (01) thiết bị dự phòng; d) Được lắp đặt và vận hành tại khu vực riêng biệt và
    được niêm phong trong suốt quá trình hoạt động để đảm bảo tất cả các đối tượng
    không có nhiệm vụ không được can thiệp vào phần cứng, phần mềm của thiết bị quay
    số mở thưởng tự động;'
- source_sentence: Bộ Tài chính quy định thế nào về thành phần  cấu trúc của Hội
    đồng giám sát xổ số trong công ty xổ số điện toán?
  sentences:
  - 'Khoản 2. Thành phần Hội đồng giám sát xổ số bao gồm Chủ tịch, một số Phó chủ
    tịch và các thành viên Hội đồng giám sát xổ số như sau: a) Chủ tịch Hội đồng giám
    sát xổ số: là Chủ tịch hoặc Tổng giám đốc của công ty xổ số điện toán; b) Phó
    chủ tịch Hội đồng giám sát xổ số: là Phó tổng giám đốc hoặc Kế toán trưởng của
    công ty xổ số điện toán; c) Các thành viên Hội đồng giám sát xổ số: là lãnh đạo
    một số phòng, ban nghiệp vụ của công ty xổ số điện toán; d) Công ty xổ số điện
    toán có thể mời đại diện một số tổ chức chính trị - xã hội tham gia Hội đồng giám
    sát xổ số với vai trò là thành viên Hội đồng giám sát xổ số.'
  - 'Điều 9. Công nhận điều chỉnh hạng, công nhận lại hạng nhà chung cư 1. Việc công
    nhận điều chỉnh hạng hoặc công nhận lại hạng nhà chung cư được thực hiện theo
    đề nghị của tổ chức, cá nhân quy định tại Điều 4 của Thông tư này. 2. Trường hợp
    quyết định công nhận hạng nhà chung cư chưa hết thời hạn theo quy định mà tổ chức,
    cá nhân quy định tại Điều 4 của Thông tư có nhu cầu điều chỉnh hạng nhà chung
    cư thì phải nộp 01 bộ hồ sơ quy định tại Khoản 3 Điều này tại Sở Xây dựng để được
    xem xét, kiểm tra và công nhận điều chỉnh hạng nhà chung cư. Trình tự, thủ tục
    công nhận điều chỉnh hạng nhà chung cư được thực hiện theo quy định tại Khoản
    2 Điều 8 của Thông tư này. Khi giao quyết định công nhận hạng nhà chung cư (đã
    điều chỉnh), Sở Xây dựng phải thu hồi bản gốc quyết định công nhận hạng đang còn
    thời hạn để lưu hồ sơ và đăng tải thông tin, văn bản quyết định trên Cổng thông
    tin điện tử của Sở Xây dựng. 3. Hồ sơ đề nghị điều chỉnh hạng nhà chung cư bao
    gồm: a) Đơn đề nghị điều chỉnh hạng nhà chung cư theo mẫu hướng dẫn tham khảo
    quy định tại phụ lục số 03 ban hành kèm theo Thông tư này;'
  - Điều 7. Hồ  đề nghị công nhận hạng nhà chung  1. Đơn đề nghị công nhận hạng
    nhà chung  theo mẫu hướng dẫn tham khảo quy định tại phụ lục số 03 ban hành
    kèm theo Thông  này. 2. Bản sao  chứng thực Giấy phép xây dựng nhà chung 
    (đối với nhà chung  thuộc diện phải  Giấy phép xây dựng theo quy định của
    pháp luật về xây dựng). 3. Bản sao  chứng thực quyết định phê duyệt quy hoạch
    chi tiết tỷ lệ 1/500 hoặc văn bản chấp thuận tổng mặt bằng khu vực  nhà chung
     (đối với trường hợp không phải lập quy hoạch chi tiết tỷ lệ 1/500) kèm theo
    bản vẽ tổng mặt bằng nhà chung  đã được  quan  thẩm quyền phê duyệt. 4.
    Bản sao  chứng thực văn bản thẩm định của  quan  thẩm quyền kèm theo bản
    vẽ thiết kế  sở nhà chung  theo quy định của pháp luật về xây dựng. 5. Bản
    sao  chứng thực văn bản thông báo kết quả kiểm tra công tác nghiệm thu hoàn
    thành công trình nhà chung  của  quan chuyên môn về xây dựng. 6. Bản tự 
    khai, đánh giá phân hạng nhà chung  của tổ chức,  nhân đề nghị công nhận hạng
    nhà chung  theo mẫu hướng dẫn tham khảo quy định tại phụ lục số 04 ban hành
    kèm theo Thông  này.
- source_sentence: Nếu đại  xổ số tự chọn số điện toán không vận hành thiết bị bán
     đúng hướng dẫn, họ sẽ phải chịu trách nhiệm gì?
  sentences:
  - 'Khoản 1. Tổ chức vận hành hệ thống xổ số tự chọn số điện toán: a) Công ty xổ
    số điện toán chịu trách nhiệm tổ chức quản lý và vận hành hệ thống xổ số tự chọn
    số điện toán theo quy định của pháp luật. Các đại lý xổ số tự chọn số điện toán
    vận hành các thiết bị bán vé xổ số tự chọn số điện toán theo hướng dẫn của công
    ty xổ số điện toán và chịu trách nhiệm về các thiết bị được giao quản lý theo
    hợp đồng ký kết giữa các bên. Các doanh nghiệp cung cấp dịch vụ mạng xã hội trực
    tuyến, doanh nghiệp viễn thông tham gia vào hoạt động kinh doanh xổ số tự chọn
    số điện toán chịu trách nhiệm đảm bảo an ninh mạng, an toàn thông tin theo quy
    định của pháp luật; b) Hệ thống xổ số tự chọn số điện toán (máy chủ, thiết bị
    đầu cuối và các thiết bị đồng bộ khác) phải được kiểm tra, bảo dưỡng, bảo trì
    theo khuyến cáo của nhà sản xuất và quy định của công ty xổ số điện toán để đảm
    bảo yêu cầu vận hành an toàn, chính xác;'
  - '2. Kiểm tra, xác nhận các nội dung liên quan đến công tác quay số mở thưởng bao
    gồm: a) Đối với hình thức quay số mở thưởng bằng lồng cầu: - Kiểm tra, xác nhận
    Hội đồng giám sát xổ số đã thực hiện nhiệm vụ kiểm tra việc khóa máy chủ để đảm
    bảo toàn bộ hệ thống không phát hành được vé ngay sau thời điểm kết thúc thời
    gian phát hành; - Kiểm tra, xác nhận việc tuân thủ quy trình quay số mở thưởng
    được quy định tại Thể lệ quay số mở thưởng đã được công bố công khai và quy định
    tại Thông tư này; - Kiểm tra, xác nhận công ty xổ số điện toán ký xác nhận bảng
    tổng hợp doanh thu; - Kiểm tra, xác nhận việc sao lưu và niêm phong dữ liệu bộ
    số dự thưởng của các kỳ quay số mở thưởng; - Kiểm tra, xác nhận việc xác nhận
    kết quả quay số mở thưởng của Hội đồng giám sát trùng khớp với kết quả quay số
    mở thưởng trên thực tế.'
  - 'Khoản 3. Cấp công trình của một tổ hợp các công trình hoặc một dây chuyền công
    nghệ gồm nhiều hạng mục được xác định như sau: a) Trường hợp tổ hợp các công trình
    hoặc dây chuyền công nghệ gồm nhiều hạng mục có quy định trong Phụ lục I Thông
    tư này thì cấp công trình được xác định theo Phụ lục I Thông tư này; b) Trường
    hợp tổ hợp các công trình hoặc dây chuyền công nghệ gồm nhiều hạng mục không quy
    định trong Phụ lục I Thông tư này thì cấp công trình được xác định theo cấp của
    công trình chính (thuộc tổ hợp các công trình hoặc dây chuyền công nghệ) có cấp
    cao nhất. Cấp của công trình chính xác định theo quy định tại khoản 2 Điều này.'
- source_sentence: Bộ Tài chính quy định công ty xổ số điện toán phải kiểm tra, bảo
    dưỡng hệ thống xổ số điện toán bao nhiêu lần trong một năm?
  sentences:
  - Điều 10. Tổ chức kiểm tra việc phân hạng  công nhận hạng nhà chung  1. Cục
    Quản  nhà  thị trường bất động sản tổ chức thực hiện kiểm tra hoặc chủ trì,
    phối hợp với các  quan, đơn vị chức năng thuộc Bộ Xây dựng  các Bộ, ngành
     liên quan tổ chức kiểm tra định kỳ hoặc đột xuất việc phân hạng  công nhận
    hạng nhà chung  trên phạm vi cả nước. 2. Sở Xây dựng các tỉnh, thành phố trực
    thuộc trung ương tổ chức thực hiện kiểm tra hoặc chủ trì, phối hợp với các 
    quan chức năng tại địa phương tổ chức kiểm tra định kỳ hoặc đột xuất việc phân
    hạng  công nhận hạng nhà chung  trên địa bàn.
  - đ) Được công ty xổ số điện toán kiểm tra, bảo dưỡng định kỳ theo khuyến cáo của
    nhà sản xuất  quy định của công ty xổ số điện toán nhưng tối đa sáu (06) tháng
    một lần. 3. Hệ thống camera, màn hình để phục vụ cho việc giám sát quay số mở
    thưởng điện tử được bố trí  những vị trí đảm bảo  thể giám sát quay số mở thưởng.
    Hình ảnh theo dõi qua camera được lưu giữ trong thời gian tối thiểu  sáu mươi
    (60) ngày, kể từ ngày quay số mở thưởng.
  - 'Khoản 1. Cấp công trình quy định tại Thông tư này được xác định theo các tiêu
    chí sau: a) Mức độ quan trọng, quy mô công suất: Áp dụng cho từng công trình độc
    lập hoặc một tổ hợp các công trình hoặc một dây chuyền công nghệ gồm nhiều hạng
    mục thuộc dự án đầu tư xây dựng công trình theo các loại công trình quy định tại
    Phụ lục I Thông tư này; b) Quy mô kết cấu: Áp dụng cho từng công trình độc lập
    thuộc dự án đầu tư xây dựng công trình theo các loại kết cấu quy định tại Phụ
    lục II Thông tư này.'
pipeline_tag: sentence-similarity
library_name: sentence-transformers
---

# SentenceTransformer based on tencent/KaLM-Embedding-Gemma3-12B-2511

This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [tencent/KaLM-Embedding-Gemma3-12B-2511](https://huggingface.co/tencent/KaLM-Embedding-Gemma3-12B-2511). It maps sentences & paragraphs to a 3840-dimensional dense vector space and can be used for retrieval.

## Model Details

### Model Description
- **Model Type:** Sentence Transformer
- **Base model:** [tencent/KaLM-Embedding-Gemma3-12B-2511](https://huggingface.co/tencent/KaLM-Embedding-Gemma3-12B-2511) <!-- at revision 98c19ba34197906fbc93f6f1ef79402ca3a33956 -->
- **Maximum Sequence Length:** 131072 tokens
- **Output Dimensionality:** 3840 dimensions
- **Similarity Function:** Cosine Similarity
- **Supported Modality:** Text
<!-- - **Training Dataset:** Unknown -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->

### Model Sources

- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/huggingface/sentence-transformers)
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)

### Full Model Architecture

```
SentenceTransformer(
  (0): Transformer({'transformer_task': 'feature-extraction', 'modality_config': {'text': {'method': 'forward', 'method_output_name': 'last_hidden_state'}}, 'module_output_name': 'token_embeddings', 'architecture': 'Gemma3TextModel'})
  (1): Pooling({'embedding_dimension': 3840, 'pooling_mode': 'lasttoken', 'include_prompt': True})
  (2): Normalize({})
)
```

## Usage

### Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

```bash
pip install -U sentence-transformers
```
Then you can load this model and run inference.
```python
from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
queries = [
    'Bộ Tài chính quy định công ty xổ số điện toán phải kiểm tra, bảo dưỡng hệ thống xổ số điện toán bao nhiêu lần trong một năm?',
]
documents = [
    'đ) Được công ty xổ số điện toán kiểm tra, bảo dưỡng định kỳ theo khuyến cáo của nhà sản xuất và quy định của công ty xổ số điện toán nhưng tối đa sáu (06) tháng một lần. 3. Hệ thống camera, màn hình để phục vụ cho việc giám sát quay số mở thưởng điện tử được bố trí ở những vị trí đảm bảo có thể giám sát quay số mở thưởng. Hình ảnh theo dõi qua camera được lưu giữ trong thời gian tối thiểu là sáu mươi (60) ngày, kể từ ngày quay số mở thưởng.',
    'Khoản 1. Cấp công trình quy định tại Thông tư này được xác định theo các tiêu chí sau: a) Mức độ quan trọng, quy mô công suất: Áp dụng cho từng công trình độc lập hoặc một tổ hợp các công trình hoặc một dây chuyền công nghệ gồm nhiều hạng mục thuộc dự án đầu tư xây dựng công trình theo các loại công trình quy định tại Phụ lục I Thông tư này; b) Quy mô kết cấu: Áp dụng cho từng công trình độc lập thuộc dự án đầu tư xây dựng công trình theo các loại kết cấu quy định tại Phụ lục II Thông tư này.',
    'Điều 10. Tổ chức kiểm tra việc phân hạng và công nhận hạng nhà chung cư 1. Cục Quản lý nhà và thị trường bất động sản tổ chức thực hiện kiểm tra hoặc chủ trì, phối hợp với các cơ quan, đơn vị chức năng thuộc Bộ Xây dựng và các Bộ, ngành có liên quan tổ chức kiểm tra định kỳ hoặc đột xuất việc phân hạng và công nhận hạng nhà chung cư trên phạm vi cả nước. 2. Sở Xây dựng các tỉnh, thành phố trực thuộc trung ương tổ chức thực hiện kiểm tra hoặc chủ trì, phối hợp với các cơ quan chức năng tại địa phương tổ chức kiểm tra định kỳ hoặc đột xuất việc phân hạng và công nhận hạng nhà chung cư trên địa bàn.',
]
query_embeddings = model.encode_query(queries)
document_embeddings = model.encode_document(documents)
print(query_embeddings.shape, document_embeddings.shape)
# [1, 3840] [3, 3840]

# Get the similarity scores for the embeddings
similarities = model.similarity(query_embeddings, document_embeddings)
print(similarities)
# tensor([[ 0.6481, -0.0205,  0.1290]])
```
<!--
### Direct Usage (Transformers)

<details><summary>Click to see the direct usage in Transformers</summary>

</details>
-->

<!--
### Downstream Usage (Sentence Transformers)

You can finetune this model on your own dataset.

<details><summary>Click to expand</summary>

</details>
-->

<!--
### Out-of-Scope Use

*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->

<!--
## Bias, Risks and Limitations

*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->

<!--
### Recommendations

*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->

## Training Details

### Training Dataset

#### Unnamed Dataset

* Size: 507,152 training samples
* Columns: <code>query</code> and <code>context</code>
* Approximate statistics based on the first 1000 samples:
  |         | query                                                                                            | context                                                                                            |
  |:--------|:-------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------|
  | type    | string                                                                                           | string                                                                                             |
  | details | <ul><li>min: 43 characters</li><li>mean: 117.84 characters</li><li>max: 318 characters</li></ul> | <ul><li>min: 444 characters</li><li>mean: 790.51 characters</li><li>max: 1195 characters</li></ul> |
* Samples:
  | query                                                                                                                                                         | context                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
  |:--------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
  | <code>Bộ Giao thông vận tải quy định các đơn vị kinh doanh vận tải nào phải lắp đặt thiết bị giám sát hành trình trên xe ô tô?</code>                         | <code>Chương I. QUY ĐỊNH CHUNG Điều 1. Phạm vi điều chỉnh. Thông tư này quy định về cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô sau (sau đây gọi chung là thiết bị giám sát hành trình). Điều 2. Đối tượng áp dụng. Thông tư này áp dụng đối với các đơn vị kinh doanh vận tải, bến xe khách, bến xe hàng, các đơn vị cung cấp dịch vụ giám sát hành trình và các cơ quan, tổ chức, cá nhân có liên quan đến việc cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô trong phạm vi toàn quốc. Điều 3. Giải thích từ ngữ. Trong Thông tư này, các từ ngữ dưới đây được hiểu như sau: 1. Hệ thống thông tin: là tập hợp các thiết bị phần cứng, phần mềm và đường truyền dùng để thu nhận, quản lý, khai thác dữ liệu từ thiết bị giám sát hành trình. 2. Dữ liệu: là tập hợp các thông tin có cấu trúc được truyền từ thiết bị giám sát hành trình về máy chủ dịch vụ và từ máy chủ dịch vụ truyền về Tổng cục Đường bộ Việt Nam.</code> |
  | <code>Bộ Giao thông vận tải giải thích như thế nào về các từ ngữ như 'hệ thống thông tin' và 'dữ liệu' trong quy định về thiết bị giám sát hành trình?</code> | <code>Chương I. QUY ĐỊNH CHUNG Điều 1. Phạm vi điều chỉnh. Thông tư này quy định về cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô sau (sau đây gọi chung là thiết bị giám sát hành trình). Điều 2. Đối tượng áp dụng. Thông tư này áp dụng đối với các đơn vị kinh doanh vận tải, bến xe khách, bến xe hàng, các đơn vị cung cấp dịch vụ giám sát hành trình và các cơ quan, tổ chức, cá nhân có liên quan đến việc cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô trong phạm vi toàn quốc. Điều 3. Giải thích từ ngữ. Trong Thông tư này, các từ ngữ dưới đây được hiểu như sau: 1. Hệ thống thông tin: là tập hợp các thiết bị phần cứng, phần mềm và đường truyền dùng để thu nhận, quản lý, khai thác dữ liệu từ thiết bị giám sát hành trình. 2. Dữ liệu: là tập hợp các thông tin có cấu trúc được truyền từ thiết bị giám sát hành trình về máy chủ dịch vụ và từ máy chủ dịch vụ truyền về Tổng cục Đường bộ Việt Nam.</code> |
  | <code>Pháp luật quy định như thế nào về việc thu nhận, quản lý và khai thác dữ liệu từ thiết bị giám sát hành trình của xe ô tô?</code>                       | <code>Chương I. QUY ĐỊNH CHUNG Điều 1. Phạm vi điều chỉnh. Thông tư này quy định về cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô sau (sau đây gọi chung là thiết bị giám sát hành trình). Điều 2. Đối tượng áp dụng. Thông tư này áp dụng đối với các đơn vị kinh doanh vận tải, bến xe khách, bến xe hàng, các đơn vị cung cấp dịch vụ giám sát hành trình và các cơ quan, tổ chức, cá nhân có liên quan đến việc cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô trong phạm vi toàn quốc. Điều 3. Giải thích từ ngữ. Trong Thông tư này, các từ ngữ dưới đây được hiểu như sau: 1. Hệ thống thông tin: là tập hợp các thiết bị phần cứng, phần mềm và đường truyền dùng để thu nhận, quản lý, khai thác dữ liệu từ thiết bị giám sát hành trình. 2. Dữ liệu: là tập hợp các thông tin có cấu trúc được truyền từ thiết bị giám sát hành trình về máy chủ dịch vụ và từ máy chủ dịch vụ truyền về Tổng cục Đường bộ Việt Nam.</code> |
* Loss: [<code>CachedMultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cachedmultiplenegativesrankingloss) with these parameters:
  ```json
  {
      "scale": 20.0,
      "similarity_fct": "cos_sim",
      "mini_batch_size": 8,
      "gather_across_devices": true,
      "directions": [
          "query_to_doc"
      ],
      "partition_mode": "joint",
      "hardness_mode": null,
      "hardness_strength": 0.0
  }
  ```

### Training Hyperparameters
#### Non-Default Hyperparameters

- `per_device_train_batch_size`: 256
- `num_train_epochs`: 1
- `learning_rate`: 1e-05
- `lr_scheduler_type`: cosine_with_min_lr
- `lr_scheduler_kwargs`: {'min_lr_rate': 0.1}
- `warmup_steps`: 0.04
- `gradient_accumulation_steps`: 4
- `bf16`: True
- `torch_compile`: True
- `torch_compile_backend`: inductor
- `use_liger_kernel`: True
- `log_level`: debug
- `dataloader_num_workers`: 8
- `dataloader_persistent_workers`: True
- `remove_unused_columns`: False
- `ddp_find_unused_parameters`: False
- `prompts`: {'query': 'Instruct: Given a user query related to law, retrieve the most relevant legal passages that directly answer the question.\nQuery: ', 'context': ''}
- `batch_sampler`: no_duplicates

#### All Hyperparameters
<details><summary>Click to expand</summary>

- `per_device_train_batch_size`: 256
- `num_train_epochs`: 1
- `max_steps`: -1
- `learning_rate`: 1e-05
- `lr_scheduler_type`: cosine_with_min_lr
- `lr_scheduler_kwargs`: {'min_lr_rate': 0.1}
- `warmup_steps`: 0.04
- `optim`: adamw_torch_fused
- `optim_args`: None
- `weight_decay`: 0.0
- `adam_beta1`: 0.9
- `adam_beta2`: 0.999
- `adam_epsilon`: 1e-08
- `optim_target_modules`: None
- `gradient_accumulation_steps`: 4
- `average_tokens_across_devices`: True
- `max_grad_norm`: 1.0
- `label_smoothing_factor`: 0.0
- `bf16`: True
- `fp16`: False
- `bf16_full_eval`: False
- `fp16_full_eval`: False
- `tf32`: None
- `gradient_checkpointing`: False
- `gradient_checkpointing_kwargs`: None
- `torch_compile`: True
- `torch_compile_backend`: inductor
- `torch_compile_mode`: None
- `use_liger_kernel`: True
- `liger_kernel_config`: None
- `use_cache`: False
- `neftune_noise_alpha`: None
- `torch_empty_cache_steps`: None
- `auto_find_batch_size`: False
- `log_on_each_node`: True
- `logging_nan_inf_filter`: True
- `include_num_input_tokens_seen`: no
- `log_level`: debug
- `log_level_replica`: warning
- `disable_tqdm`: False
- `project`: huggingface
- `trackio_space_id`: trackio
- `per_device_eval_batch_size`: 8
- `prediction_loss_only`: True
- `eval_on_start`: False
- `eval_do_concat_batches`: True
- `eval_use_gather_object`: False
- `eval_accumulation_steps`: None
- `include_for_metrics`: []
- `batch_eval_metrics`: False
- `save_only_model`: False
- `save_on_each_node`: False
- `enable_jit_checkpoint`: False
- `push_to_hub`: False
- `hub_private_repo`: None
- `hub_model_id`: None
- `hub_strategy`: every_save
- `hub_always_push`: False
- `hub_revision`: None
- `load_best_model_at_end`: False
- `ignore_data_skip`: False
- `restore_callback_states_from_checkpoint`: False
- `full_determinism`: False
- `seed`: 42
- `data_seed`: None
- `use_cpu`: False
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
- `parallelism_config`: None
- `dataloader_drop_last`: True
- `dataloader_num_workers`: 8
- `dataloader_pin_memory`: True
- `dataloader_persistent_workers`: True
- `dataloader_prefetch_factor`: None
- `remove_unused_columns`: False
- `label_names`: None
- `train_sampling_strategy`: random
- `length_column_name`: length
- `ddp_find_unused_parameters`: False
- `ddp_bucket_cap_mb`: None
- `ddp_broadcast_buffers`: False
- `ddp_backend`: None
- `ddp_timeout`: 1800
- `fsdp`: []
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
- `deepspeed`: None
- `debug`: []
- `skip_memory_metrics`: True
- `do_predict`: False
- `resume_from_checkpoint`: None
- `warmup_ratio`: None
- `local_rank`: -1
- `prompts`: {'query': 'Instruct: Given a user query related to law, retrieve the most relevant legal passages that directly answer the question.\nQuery: ', 'context': ''}
- `batch_sampler`: no_duplicates
- `multi_dataset_batch_sampler`: proportional
- `router_mapping`: {}
- `learning_rate_mapping`: {}

</details>

### Training Logs
| Epoch  | Step | Training Loss |
|:------:|:----:|:-------------:|
| 0.0242 | 3    | 0.6319        |
| 0.0485 | 6    | 0.2005        |
| 0.0727 | 9    | 0.1443        |
| 0.0970 | 12   | 0.1130        |
| 0.1212 | 15   | 0.1057        |
| 0.1455 | 18   | 0.0985        |
| 0.1697 | 21   | 0.0986        |
| 0.1939 | 24   | 0.0921        |
| 0.2182 | 27   | 0.0837        |
| 0.2424 | 30   | 0.0845        |
| 0.2667 | 33   | 0.0793        |
| 0.2909 | 36   | 0.0752        |
| 0.3152 | 39   | 0.0797        |
| 0.3394 | 42   | 0.0745        |
| 0.3636 | 45   | 0.0812        |
| 0.3879 | 48   | 0.0711        |
| 0.4121 | 51   | 0.0803        |
| 0.4364 | 54   | 0.0761        |
| 0.4606 | 57   | 0.0785        |
| 0.4848 | 60   | 0.0714        |
| 0.5091 | 63   | 0.0719        |
| 0.5333 | 66   | 0.0736        |
| 0.5576 | 69   | 0.0745        |
| 0.5818 | 72   | 0.0718        |
| 0.6061 | 75   | 0.0720        |
| 0.6303 | 78   | 0.0750        |
| 0.6545 | 81   | 0.0690        |
| 0.6788 | 84   | 0.0719        |
| 0.7030 | 87   | 0.0716        |
| 0.7273 | 90   | 0.0723        |
| 0.7515 | 93   | 0.0731        |
| 0.7758 | 96   | 0.0670        |
| 0.8    | 99   | 0.0682        |
| 0.8242 | 102  | 0.0727        |
| 0.8485 | 105  | 0.0717        |
| 0.8727 | 108  | 0.0695        |
| 0.8970 | 111  | 0.0669        |
| 0.9212 | 114  | 0.0699        |
| 0.9455 | 117  | 0.0697        |
| 0.9697 | 120  | 0.0736        |
| 0.9939 | 123  | 0.0665        |


### Training Time
- **Training**: 2.9 hours

### Framework Versions
- Python: 3.12.13
- Sentence Transformers: 5.4.1
- Transformers: 5.5.4
- PyTorch: 2.11.0+cu130
- Accelerate: 1.13.0
- Datasets: 2.19.1
- Tokenizers: 0.22.2

## Citation

### BibTeX

#### Sentence Transformers
```bibtex
@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}
```

#### CachedMultipleNegativesRankingLoss
```bibtex
@misc{gao2021scaling,
    title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
    author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
    year={2021},
    eprint={2101.06983},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}
```

<!--
## Glossary

*Clearly define terms in order to be accessible across audiences.*
-->

<!--
## Model Card Authors

*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->

<!--
## Model Card Contact

*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
-->