{ "version": "1.0", "truncation": null, "padding": null, "added_tokens": [ { "id": 0, "content": "", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true } ], "normalizer": { "type": "Replace", "pattern": { "String": " " }, "content": "▁" }, "pre_tokenizer": null, "post_processor": null, "decoder": null, "model": { "type": "Unigram", "unk_id": 0, "vocab": [ [ "", 0.0 ], [ "▁t", -0.0 ], [ "▁th", -1.0 ], [ "▁a", -2.0 ], [ "in", -3.0 ], [ "▁the", -4.0 ], [ "re", -5.0 ], [ "▁w", -6.0 ], [ "▁o", -7.0 ], [ "▁s", -8.0 ], [ "er", -9.0 ], [ "at", -10.0 ], [ "ou", -11.0 ], [ "nd", -12.0 ], [ "it", -13.0 ], [ "is", -14.0 ], [ "▁h", -15.0 ], [ "▁b", -16.0 ], [ "on", -17.0 ], [ "▁c", -18.0 ], [ "ing", -19.0 ], [ "en", -20.0 ], [ "▁to", -21.0 ], [ "▁m", -22.0 ], [ "▁f", -23.0 ], [ "▁p", -24.0 ], [ "or", -25.0 ], [ "an", -26.0 ], [ "es", -27.0 ], [ "▁of", -28.0 ], [ "▁d", -29.0 ], [ "ed", -30.0 ], [ "ll", -31.0 ], [ "▁and", -32.0 ], [ "▁I", -33.0 ], [ "▁in", -34.0 ], [ "▁l", -35.0 ], [ "ar", -36.0 ], [ "▁y", -37.0 ], [ "▁g", -38.0 ], [ "as", -39.0 ], [ "▁you", -40.0 ], [ "om", -41.0 ], [ "▁n", -42.0 ], [ "ic", -43.0 ], [ "ve", -44.0 ], [ "al", -45.0 ], [ "ion", -46.0 ], [ "us", -47.0 ], [ "▁be", -48.0 ], [ "ow", -49.0 ], [ "le", -50.0 ], [ "▁wh", -51.0 ], [ "▁e", -52.0 ], [ "ot", -53.0 ], [ "ut", -54.0 ], [ "▁it", -55.0 ], [ "▁is", -56.0 ], [ "▁we", -57.0 ], [ "▁T", -58.0 ], [ "▁re", -59.0 ], [ "et", -60.0 ], [ "▁A", -61.0 ], [ "ent", -62.0 ], [ "▁on", -63.0 ], [ "▁ha", -64.0 ], [ "ay", -65.0 ], [ "▁S", -66.0 ], [ "ct", -67.0 ], [ "▁Th", -68.0 ], [ "ver", -69.0 ], [ "id", -70.0 ], [ "ig", -71.0 ], [ "im", -72.0 ], [ "ro", -73.0 ], [ "▁for", -74.0 ], [ "ly", -75.0 ], [ "▁he", -76.0 ], [ "ke", -77.0 ], [ "ld", -78.0 ], [ "se", -79.0 ], [ "st", -80.0 ], [ "ch", -81.0 ], [ "▁st", -82.0 ], [ "all", -83.0 ], [ "ce", -84.0 ], [ "ur", -85.0 ], [ "ith", -86.0 ], [ "am", -87.0 ], [ "if", -88.0 ], [ "ir", -89.0 ], [ "▁go", -90.0 ], [ "▁u", -91.0 ], [ "▁as", -92.0 ], [ "▁was", -93.0 ], [ "ad", -94.0 ], [ "▁W", -95.0 ], [ "▁k", -96.0 ], [ "▁an", -97.0 ], [ "ht", -98.0 ], [ "th", -99.0 ], [ "▁r", -100.0 ], [ "▁are", -101.0 ], [ "ere", -102.0 ], [ "▁se", -103.0 ], [ "▁do", -104.0 ], [ "▁B", -105.0 ], [ "▁so", -106.0 ], [ "▁sh", -107.0 ], [ "▁not", -108.0 ], [ "▁li", -109.0 ], [ "od", -110.0 ], [ "▁C", -111.0 ], [ "ust", -112.0 ], [ "ill", -113.0 ], [ "ight", -114.0 ], [ "ally", -115.0 ], [ "▁And", -116.0 ], [ "ter", -117.0 ], [ "▁or", -118.0 ], [ "▁me", -119.0 ], [ "▁M", -120.0 ], [ "ome", -121.0 ], [ "op", -122.0 ], [ "▁at", -123.0 ], [ "il", -124.0 ], [ "▁The", -125.0 ], [ "ould", -126.0 ], [ "▁j", -127.0 ], [ "ant", -128.0 ], [ "▁So", -129.0 ], [ "▁H", -130.0 ], [ "ol", -131.0 ], [ "ain", -132.0 ], [ "▁can", -133.0 ], [ "▁de", -134.0 ], [ "▁ne", -135.0 ], [ "ore", -136.0 ], [ "▁con", -137.0 ], [ "▁kn", -138.0 ], [ "ck", -139.0 ], [ "ul", -140.0 ], [ "▁fr", -141.0 ], [ "▁ab", -142.0 ], [ "ers", -143.0 ], [ "ess", -144.0 ], [ "ge", -145.0 ], [ "▁pro", -146.0 ], [ "pe", -147.0 ], [ "ate", -148.0 ], [ "▁su", -149.0 ], [ "▁com", -150.0 ], [ "▁but", -151.0 ], [ "▁all", -152.0 ], [ "est", -153.0 ], [ "qu", -154.0 ], [ "▁ex", -155.0 ], [ "▁al", -156.0 ], [ "ra", -157.0 ], [ "▁O", -158.0 ], [ "out", -159.0 ], [ "use", -160.0 ], [ "very", -161.0 ], [ "pp", -162.0 ], [ "▁Y", -163.0 ], [ "▁ch", -164.0 ], [ "ri", -165.0 ], [ "ist", -166.0 ], [ "▁v", -167.0 ], [ "▁lo", -168.0 ], [ "ment", -169.0 ], [ "art", -170.0 ], [ "▁P", -171.0 ], [ "nt", -172.0 ], [ "ab", -173.0 ], [ "▁one", -174.0 ], [ "▁N", -175.0 ], [ "ive", -176.0 ], [ "▁wor", -177.0 ], [ "ions", -178.0 ], [ "ort", -179.0 ], [ "▁L", -180.0 ], [ "▁by", -181.0 ], [ "ich", -182.0 ], [ "▁my", -183.0 ], [ "ity", -184.0 ], [ "ok", -185.0 ], [ "▁G", -186.0 ], [ "res", -187.0 ], [ "▁up", -188.0 ], [ "un", -189.0 ], [ "um", -190.0 ], [ "ea", -191.0 ], [ "ind", -192.0 ], [ "and", -193.0 ], [ "ink", -194.0 ], [ "el", -195.0 ], [ "▁D", -196.0 ], [ "em", -197.0 ], [ "▁E", -198.0 ], [ "os", -199.0 ], [ "oug", -200.0 ], [ "▁if", -201.0 ], [ "ca", -202.0 ], [ "▁out", -203.0 ], [ "▁int", -204.0 ], [ "ie", -205.0 ], [ "▁F", -206.0 ], [ "▁It", -207.0 ], [ "▁his", -208.0 ], [ "ard", -209.0 ], [ "▁had", -210.0 ], [ "▁tr", -211.0 ], [ "her", -212.0 ], [ "our", -213.0 ], [ "ies", -214.0 ], [ "ake", -215.0 ], [ "▁R", -216.0 ], [ "▁We", -217.0 ], [ "▁get", -218.0 ], [ "▁don", -219.0 ], [ "▁us", -220.0 ], [ "ak", -221.0 ], [ "▁pl", -222.0 ], [ "ect", -223.0 ], [ "ure", -224.0 ], [ "ame", -225.0 ], [ "ast", -226.0 ], [ "▁who", -227.0 ], [ "ack", -228.0 ], [ "▁le", -229.0 ], [ "▁sa", -230.0 ], [ "iv", -231.0 ], [ "ci", -232.0 ], [ "ide", -233.0 ], [ "▁tim", -234.0 ], [ "▁our", -235.0 ], [ "ound", -236.0 ], [ "ous", -237.0 ], [ "▁co", -238.0 ], [ "▁pe", -239.0 ], [ "ose", -240.0 ], [ "ud", -241.0 ], [ "▁see", -242.0 ], [ "ough", -243.0 ], [ "▁man", -244.0 ], [ "▁qu", -245.0 ], [ "▁You", -246.0 ], [ "so", -247.0 ], [ "ople", -248.0 ], [ "▁Wh", -249.0 ], [ "ong", -250.0 ], [ "ap", -251.0 ], [ "ther", -252.0 ], [ "▁J", -253.0 ], [ "are", -254.0 ], [ "ine", -255.0 ], [ "▁say", -256.0 ], [ "▁im", -257.0 ], [ "▁But", -258.0 ], [ "ings", -259.0 ], [ "▁has", -260.0 ], [ "▁ag", -261.0 ], [ "ff", -262.0 ], [ "▁her", -263.0 ], [ "itt", -264.0 ], [ "one", -265.0 ], [ "▁en", -266.0 ], [ "▁ar", -267.0 ], [ "▁fe", -268.0 ], [ "ven", -269.0 ], [ "▁any", -270.0 ], [ "▁mo", -271.0 ], [ "reat", -272.0 ], [ "ag", -273.0 ], [ "▁how", -274.0 ], [ "▁cl", -275.0 ], [ "pt", -276.0 ], [ "▁now", -277.0 ], [ "own", -278.0 ], [ "ber", -279.0 ], [ "▁him", -280.0 ], [ "▁act", -281.0 ], [ "hing", -282.0 ], [ "ice", -283.0 ], [ "▁no", -284.0 ], [ "ans", -285.0 ], [ "iz", -286.0 ], [ "▁fa", -287.0 ], [ "per", -288.0 ], [ "pl", -289.0 ], [ "▁te", -290.0 ], [ "▁ad", -291.0 ], [ "age", -292.0 ], [ "ree", -293.0 ], [ "▁tw", -294.0 ], [ "ank", -295.0 ], [ "▁He", -296.0 ], [ "ple", -297.0 ], [ "ite", -298.0 ], [ "ry", -299.0 ], [ "▁U", -300.0 ], [ "ish", -301.0 ], [ "ire", -302.0 ], [ "ue", -303.0 ], [ "▁In", -304.0 ], [ "▁she", -305.0 ], [ "ble", -306.0 ], [ "cc", -307.0 ], [ "nder", -308.0 ], [ "▁way", -309.0 ], [ "▁pr", -310.0 ], [ "ear", -311.0 ], [ "▁did", -312.0 ], [ "▁po", -313.0 ], [ "eah", -314.0 ], [ "▁un", -315.0 ], [ "omet", -316.0 ], [ "ence", -317.0 ], [ "ep", -318.0 ], [ "uch", -319.0 ], [ "▁sp", -320.0 ], [ "ach", -321.0 ], [ "og", -322.0 ], [ "ance", -323.0 ], [ "able", -324.0 ], [ "iff", -325.0 ], [ "sel", -326.0 ], [ "▁got", -327.0 ], [ "way", -328.0 ], [ "▁gr", -329.0 ], [ "alk", -330.0 ], [ "▁res", -331.0 ], [ "ated", -332.0 ], [ "irst", -333.0 ], [ "ick", -334.0 ], [ "ass", -335.0 ], [ "▁two", -336.0 ], [ "▁dis", -337.0 ], [ "ord", -338.0 ], [ "▁pre", -339.0 ], [ "ount", -340.0 ], [ "ase", -341.0 ], [ "ip", -342.0 ], [ "ult", -343.0 ], [ "ical", -344.0 ], [ "orm", -345.0 ], [ "ary", -346.0 ], [ "ace", -347.0 ], [ "▁spe", -348.0 ], [ "▁Ch", -349.0 ], [ "▁thr", -350.0 ], [ "▁imp", -351.0 ], [ "int", -352.0 ], [ "▁am", -353.0 ], [ "▁off", -354.0 ], [ "act", -355.0 ], [ "ia", -356.0 ], [ "▁ro", -357.0 ], [ "ress", -358.0 ], [ "▁per", -359.0 ], [ "▁fo", -360.0 ], [ "▁br", -361.0 ], [ "▁K", -362.0 ], [ "vel", -363.0 ], [ "▁gu", -364.0 ], [ "▁bo", -365.0 ], [ "ang", -366.0 ], [ "kay", -367.0 ], [ "ub", -368.0 ], [ "ign", -369.0 ], [ "▁may", -370.0 ], [ "ving", -371.0 ], [ "ces", -372.0 ], [ "ens", -373.0 ], [ "cl", -374.0 ], [ "▁lot", -375.0 ], [ "ru", -376.0 ], [ "ade", -377.0 ], [ "▁bet", -378.0 ], [ "▁bl", -379.0 ], [ "▁let", -380.0 ], [ "fore", -381.0 ], [ "co", -382.0 ], [ "ild", -383.0 ], [ "ning", -384.0 ], [ "xt", -385.0 ], [ "ile", -386.0 ], [ "ark", -387.0 ], [ "self", -388.0 ], [ "▁app", -389.0 ], [ "ory", -390.0 ], [ "du", -391.0 ], [ "▁day", -392.0 ], [ "▁St", -393.0 ], [ "ater", -394.0 ], [ "▁use", -395.0 ], [ "ys", -396.0 ], [ "fter", -397.0 ], [ "▁new", -398.0 ], [ "ious", -399.0 ], [ "ial", -400.0 ], [ "he", -401.0 ], [ "wn", -402.0 ], [ "ved", -403.0 ], [ "red", -404.0 ], [ "▁fl", -405.0 ], [ "iss", -406.0 ], [ "ody", -407.0 ], [ "form", -408.0 ], [ "ian", -409.0 ], [ "tain", -410.0 ], [ "▁bu", -411.0 ], [ "▁V", -412.0 ], [ "▁rec", -413.0 ], [ "ty", -414.0 ], [ "be", -415.0 ], [ "▁sc", -416.0 ], [ "ors", -417.0 ], [ "vers", -418.0 ], [ "▁put", -419.0 ], [ "ife", -420.0 ], [ "▁If", -421.0 ], [ "we", -422.0 ], [ "te", -423.0 ], [ "ject", -424.0 ], [ "ath", -425.0 ], [ "ting", -426.0 ], [ "▁rem", -427.0 ], [ "▁acc", -428.0 ], [ "ull", -429.0 ], [ "ons", -430.0 ], [ "▁ind", -431.0 ], [ "▁ser", -432.0 ], [ "▁ke", -433.0 ], [ "ates", -434.0 ], [ "ves", -435.0 ], [ "na", -436.0 ], [ "lic", -437.0 ], [ "▁des", -438.0 ], [ "▁its", -439.0 ], [ "ful", -440.0 ], [ "ents", -441.0 ], [ "erm", -442.0 ], [ "ac", -443.0 ], [ "ered", -444.0 ], [ "ise", -445.0 ], [ "▁sy", -446.0 ], [ "urn", -447.0 ], [ "▁em", -448.0 ], [ "oth", -449.0 ], [ "ual", -450.0 ], [ "ne", -451.0 ], [ "ward", -452.0 ], [ "ib", -453.0 ], [ "▁try", -454.0 ], [ "▁pos", -455.0 ], [ "nds", -456.0 ], [ "ft", -457.0 ], [ "get", -458.0 ], [ "ph", -459.0 ], [ "▁ob", -460.0 ], [ "ady", -461.0 ], [ "igh", -462.0 ], [ "ood", -463.0 ], [ "▁rel", -464.0 ], [ "▁wr", -465.0 ], [ "ug", -466.0 ], [ "ears", -467.0 ], [ "ail", -468.0 ], [ "▁Now", -469.0 ], [ "▁bit", -470.0 ], [ "ng", -471.0 ], [ "▁Oh", -472.0 ], [ "▁hel", -473.0 ], [ "ange", -474.0 ], [ "▁reg", -475.0 ], [ "▁rep", -476.0 ], [ "▁bel", -477.0 ], [ "▁sm", -478.0 ], [ "ost", -479.0 ], [ "tern", -480.0 ], [ "gr", -481.0 ], [ "▁own", -482.0 ], [ "▁end", -483.0 ], [ "pect", -484.0 ], [ "ily", -485.0 ], [ "day", -486.0 ], [ "ied", -487.0 ], [ "ific", -488.0 ], [ "ower", -489.0 ], [ "▁add", -490.0 ], [ "cess", -491.0 ], [ "ict", -492.0 ], [ "ible", -493.0 ], [ "▁bas", -494.0 ], [ "▁i", -495.0 ], [ "▁op", -496.0 ], [ "cial", -497.0 ], [ "ular", -498.0 ], [ "▁Be", -499.0 ], [ "ced", -500.0 ], [ "▁too", -501.0 ], [ "ks", -502.0 ], [ "ew", -503.0 ], [ "mer", -504.0 ], [ "▁ph", -505.0 ], [ "ob", -506.0 ], [ "==", -507.0 ], [ "▁la", -508.0 ], [ "▁set", -509.0 ], [ "▁min", -510.0 ], [ "▁sub", -511.0 ], [ "▁gen", -512.0 ], [ "atch", -513.0 ], [ "..", -514.0 ], [ "▁inv", -515.0 ], [ "▁As", -516.0 ], [ "▁nat", -517.0 ], [ "▁sl", -518.0 ], [ "▁num", -519.0 ], [ "av", -520.0 ], [ "ways", -521.0 ], [ "▁God", -522.0 ], [ "stem", -523.0 ], [ "▁ac", -524.0 ], [ "▁att", -525.0 ], [ "▁ev", -526.0 ], [ "▁def", -527.0 ], [ "llow", -528.0 ], [ "▁str", -529.0 ], [ "lect", -530.0 ], [ "ars", -531.0 ], [ "▁cr", -532.0 ], [ "▁Is", -533.0 ], [ "olog", -534.0 ], [ "les", -535.0 ], [ "oy", -536.0 ], [ "▁ask", -537.0 ], [ "▁inc", -538.0 ], [ "body", -539.0 ], [ "▁ent", -540.0 ], [ "▁pol", -541.0 ], [ "ness", -542.0 ], [ "ix", -543.0 ], [ "▁why", -544.0 ], [ "onna", -545.0 ], [ "▁ear", -546.0 ], [ "▁tak", -547.0 ], [ "▁Un", -548.0 ], [ "ited", -549.0 ], [ "mun", -550.0 ], [ "li", -551.0 ], [ "ute", -552.0 ], [ "ract", -553.0 ], [ "▁dec", -554.0 ], [ "uro", -555.0 ], [ "▁mak", -556.0 ], [ "▁fin", -557.0 ], [ "ween", -558.0 ], [ "▁No", -559.0 ], [ "arch", -560.0 ], [ "▁bec", -561.0 ], [ "gan", -562.0 ], [ "old", -563.0 ], [ "cy", -564.0 ], [ "▁big", -565.0 ], [ "▁For", -566.0 ], [ "ren", -567.0 ], [ "als", -568.0 ], [ "und", -569.0 ], [ "▁Al", -570.0 ], [ "▁All", -571.0 ], [ "ss", -572.0 ], [ "ows", -573.0 ], [ "▁mod", -574.0 ], [ "ock", -575.0 ], [ "▁id", -576.0 ], [ "ism", -577.0 ], [ "cus", -578.0 ], [ "▁gl", -579.0 ], [ "ably", -580.0 ], [ "▁ass", -581.0 ], [ "▁car", -582.0 ], [ "ata", -583.0 ], [ "ppen", -584.0 ], [ "led", -585.0 ], [ "▁sim", -586.0 ], [ "▁mon", -587.0 ], [ "ics", -588.0 ], [ "▁giv", -589.0 ], [ "cept", -590.0 ], [ "▁Mr", -591.0 ], [ "pan", -592.0 ], [ "▁pub", -593.0 ], [ "▁eff", -594.0 ], [ "▁How", -595.0 ], [ "ps", -596.0 ], [ "vern", -597.0 ], [ "end", -598.0 ], [ "hip", -599.0 ], [ "iew", -600.0 ], [ "ope", -601.0 ], [ "▁An", -602.0 ], [ "▁She", -603.0 ], [ "▁Com", -604.0 ], [ "ee", -605.0 ], [ "ures", -606.0 ], [ "ell", -607.0 ], [ "ouse", -608.0 ], [ "cond", -609.0 ], [ "king", -610.0 ], [ "oc", -611.0 ], [ "ues", -612.0 ], [ "ever", -613.0 ], [ "▁To", -614.0 ], [ "clud", -615.0 ], [ "▁ins", -616.0 ], [ "▁exp", -617.0 ], [ "▁old", -618.0 ], [ "▁mem", -619.0 ], [ "▁ref", -620.0 ], [ "▁tra", -621.0 ], [ "▁far", -622.0 ], [ "ave", -623.0 ], [ "rat", -624.0 ], [ "▁sur", -625.0 ], [ "ruct", -626.0 ], [ "rib", -627.0 ], [ "duct", -628.0 ], [ "uff", -629.0 ], [ "▁met", -630.0 ], [ "▁sch", -631.0 ], [ "ince", -632.0 ], [ "▁run", -633.0 ], [ "ense", -634.0 ], [ "▁cle", -635.0 ], [ "▁==", -636.0 ], [ "mon", -637.0 ], [ "ize", -638.0 ], [ "▁ord", -639.0 ], [ "blem", -640.0 ], [ "tin", -641.0 ], [ "▁Let", -642.0 ], [ "ner", -643.0 ], [ "ond", -644.0 ], [ "its", -645.0 ], [ "▁cor", -646.0 ], [ "land", -647.0 ], [ "▁cur", -648.0 ], [ "▁Re", -649.0 ], [ "▁bus", -650.0 ], [ "▁uh", -651.0 ], [ "air", -652.0 ], [ "ote", -653.0 ], [ "ants", -654.0 ], [ "ason", -655.0 ], [ "ric", -656.0 ], [ "▁el", -657.0 ], [ "▁cer", -658.0 ], [ "nce", -659.0 ], [ "▁fam", -660.0 ], [ "▁cap", -661.0 ], [ "uck", -662.0 ], [ "ool", -663.0 ], [ "ried", -664.0 ], [ "▁cou", -665.0 ], [ "▁fun", -666.0 ], [ "▁wom", -667.0 ], [ "▁hum", -668.0 ], [ "▁ty", -669.0 ], [ "▁ap", -670.0 ], [ "ike", -671.0 ], [ "▁few", -672.0 ], [ "oney", -673.0 ], [ "▁inf", -674.0 ], [ "ont", -675.0 ], [ "ese", -676.0 ], [ "ook", -677.0 ], [ "gy", -678.0 ], [ "uth", -679.0 ], [ "ulat", -680.0 ], [ "ieve", -681.0 ], [ "ized", -682.0 ], [ "ross", -683.0 ], [ "▁ple", -684.0 ], [ "▁um", -685.0 ], [ "▁val", -686.0 ], [ "▁equ", -687.0 ], [ "▁lea", -688.0 ], [ "▁lar", -689.0 ], [ "ah", -690.0 ], [ "eral", -691.0 ], [ "▁ed", -692.0 ], [ "ared", -693.0 ], [ "lish", -694.0 ], [ "arn", -695.0 ], [ "ds", -696.0 ], [ "esn", -697.0 ], [ "▁iss", -698.0 ], [ "▁ca", -699.0 ], [ "ted", -700.0 ], [ "ices", -701.0 ], [ "▁wee", -702.0 ], [ "ash", -703.0 ], [ "▁top", -704.0 ], [ "ten", -705.0 ], [ "up", -706.0 ], [ "ts", -707.0 ], [ "gin", -708.0 ], [ "con", -709.0 ], [ "ari", -710.0 ], [ "▁opp", -711.0 ], [ "osed", -712.0 ], [ "▁eas", -713.0 ], [ "▁ext", -714.0 ], [ "gg", -715.0 ], [ "az", -716.0 ], [ "▁Fr", -717.0 ], [ "ideo", -718.0 ], [ "izat", -719.0 ], [ "▁men", -720.0 ], [ "▁mom", -721.0 ], [ "▁ret", -722.0 ], [ "tty", -723.0 ], [ "rist", -724.0 ], [ "▁gra", -725.0 ], [ "alth", -726.0 ], [ "ef", -727.0 ], [ "▁det", -728.0 ], [ "ax", -729.0 ], [ "▁mat", -730.0 ], [ "chn", -731.0 ], [ "ern", -732.0 ], [ "peri", -733.0 ], [ "▁bre", -734.0 ], [ "▁Sh", -735.0 ], [ "sw", -736.0 ], [ "erat", -737.0 ], [ "▁sit", -738.0 ], [ "ters", -739.0 ], [ "ale", -740.0 ], [ "man", -741.0 ], [ "▁sol", -742.0 ], [ "ork", -743.0 ], [ "▁adv", -744.0 ], [ "ety", -745.0 ], [ "▁vis", -746.0 ], [ "▁med", -747.0 ], [ "uc", -748.0 ], [ "less", -749.0 ], [ "▁unt", -750.0 ], [ "gram", -751.0 ], [ "ets", -752.0 ], [ "ists", -753.0 ], [ "▁ey", -754.0 ], [ "▁col", -755.0 ], [ "imes", -756.0 ], [ "▁law", -757.0 ], [ "▁pri", -758.0 ], [ "sid", -759.0 ], [ "▁On", -760.0 ], [ "▁mot", -761.0 ], [ "ield", -762.0 ], [ "▁Do", -763.0 ], [ "▁At", -764.0 ], [ "ages", -765.0 ], [ "amp", -766.0 ], [ "▁art", -767.0 ], [ "miss", -768.0 ], [ "▁sk", -769.0 ], [ "alf", -770.0 ], [ "pr", -771.0 ], [ "ier", -772.0 ], [ "▁beh", -773.0 ], [ "▁Yes", -774.0 ], [ "ural", -775.0 ], [ "ime", -776.0 ], [ "▁wa", -777.0 ], [ "oks", -778.0 ], [ "bers", -779.0 ], [ "ger", -780.0 ], [ "ient", -781.0 ], [ "ries", -782.0 ], [ "...", -783.0 ], [ "▁che", -784.0 ], [ "▁Br", -785.0 ], [ "ird", -786.0 ], [ "▁Ar", -787.0 ], [ "▁war", -788.0 ], [ "inat", -789.0 ], [ "▁My", -790.0 ], [ "ital", -791.0 ], [ "wh", -792.0 ], [ "med", -793.0 ], [ "▁pur", -794.0 ], [ "ully", -795.0 ], [ "▁One", -796.0 ], [ "▁rat", -797.0 ], [ "ines", -798.0 ], [ "▁Of", -799.0 ], [ "io", -800.0 ], [ "▁loc", -801.0 ], [ "ret", -802.0 ], [ "ctor", -803.0 ], [ "▁leg", -804.0 ], [ "stit", -805.0 ], [ "ined", -806.0 ], [ "ught", -807.0 ], [ "▁dur", -808.0 ], [ "▁es", -809.0 ], [ "vent", -810.0 ], [ "aj", -811.0 ], [ "▁bro", -812.0 ], [ "▁saw", -813.0 ], [ "▁sec", -814.0 ], [ "ream", -815.0 ], [ "▁pop", -816.0 ], [ "reen", -817.0 ], [ "▁Ind", -818.0 ], [ "els", -819.0 ], [ "▁yet", -820.0 ], [ "ired", -821.0 ], [ "▁sw", -822.0 ], [ "tro", -823.0 ], [ "oup", -824.0 ], [ "most", -825.0 ], [ "pean", -826.0 ], [ "eds", -827.0 ], [ "ush", -828.0 ], [ "oh", -829.0 ], [ "▁Se", -830.0 ], [ "▁tea", -831.0 ], [ "ann", -832.0 ], [ "ilit", -833.0 ], [ "err", -834.0 ], [ "pend", -835.0 ], [ "ton", -836.0 ], [ "ased", -837.0 ], [ "▁aff", -838.0 ], [ "▁mor", -839.0 ], [ "▁dra", -840.0 ], [ "put", -841.0 ], [ "▁dr", -842.0 ], [ "ins", -843.0 ], [ "uat", -844.0 ], [ "nect", -845.0 ], [ "cri", -846.0 ], [ "outh", -847.0 ], [ "▁ra", -848.0 ], [ "▁pay", -849.0 ], [ "ms", -850.0 ], [ "▁av", -851.0 ], [ "bs", -852.0 ], [ "ling", -853.0 ], [ "▁De", -854.0 ], [ "▁Or", -855.0 ], [ "ove", -856.0 ], [ "▁Can", -857.0 ], [ "▁eng", -858.0 ], [ "ames", -859.0 ], [ "ided", -860.0 ], [ "▁Go", -861.0 ], [ "mitt", -862.0 ], [ "ode", -863.0 ], [ "▁cre", -864.0 ], [ "par", -865.0 ], [ "ides", -866.0 ], [ "pos", -867.0 ], [ "▁fav", -868.0 ], [ "▁air", -869.0 ], [ "▁New", -870.0 ], [ "▁bad", -871.0 ], [ "▁six", -872.0 ], [ "vat", -873.0 ], [ "▁pat", -874.0 ], [ "not", -875.0 ], [ "▁di", -876.0 ], [ "rop", -877.0 ], [ "ral", -878.0 ], [ "orn", -879.0 ], [ "▁par", -880.0 ], [ "cing", -881.0 ], [ "▁aw", -882.0 ], [ "orts", -883.0 ], [ "ox", -884.0 ], [ "▁yes", -885.0 ], [ "cuss", -886.0 ], [ "eng", -887.0 ], [ "ives", -888.0 ], [ "erms", -889.0 ], [ "▁job", -890.0 ], [ "mand", -891.0 ], [ "ying", -892.0 ], [ "▁occ", -893.0 ], [ "aps", -894.0 ], [ "ases", -895.0 ], [ "▁Not", -896.0 ], [ "rent", -897.0 ], [ "ency", -898.0 ], [ "att", -899.0 ], [ "ised", -900.0 ], [ "vice", -901.0 ], [ "▁Eng", -902.0 ], [ "▁est", -903.0 ], [ "oked", -904.0 ], [ "▁Q", -905.0 ], [ "iron", -906.0 ], [ "idd", -907.0 ], [ "me", -908.0 ], [ "unch", -909.0 ], [ "ane", -910.0 ], [ "▁z", -911.0 ], [ "br", -912.0 ], [ "arts", -913.0 ], [ "▁fat", -914.0 ], [ "ery", -915.0 ], [ "anks", -916.0 ], [ "▁jo", -917.0 ], [ "▁mar", -918.0 ], [ "aw", -919.0 ], [ "ott", -920.0 ], [ "ards", -921.0 ], [ "▁oh", -922.0 ], [ "ians", -923.0 ], [ "▁sci", -924.0 ], [ "row", -925.0 ], [ "unt", -926.0 ], [ "ury", -927.0 ], [ "▁abs", -928.0 ], [ "ergy", -929.0 ], [ "▁Z", -930.0 ], [ "ump", -931.0 ], [ "▁Am", -932.0 ], [ "ened", -933.0 ], [ "angu", -934.0 ], [ "▁Pro", -935.0 ], [ "icat", -936.0 ], [ "itch", -937.0 ], [ "▁dri", -938.0 ], [ "iat", -939.0 ], [ "▁", -940.0 ], [ "e", -941.0 ], [ "t", -942.0 ], [ "o", -943.0 ], [ "a", -944.0 ], [ "n", -945.0 ], [ "i", -946.0 ], [ "s", -947.0 ], [ "r", -948.0 ], [ "h", -949.0 ], [ "l", -950.0 ], [ "d", -951.0 ], [ "u", -952.0 ], [ "c", -953.0 ], [ "m", -954.0 ], [ "y", -955.0 ], [ "g", -956.0 ], [ "w", -957.0 ], [ "f", -958.0 ], [ "p", -959.0 ], [ ",", -960.0 ], [ ".", -961.0 ], [ "b", -962.0 ], [ "v", -963.0 ], [ "k", -964.0 ], [ "'", -965.0 ], [ "I", -966.0 ], [ "T", -967.0 ], [ "A", -968.0 ], [ "S", -969.0 ], [ "x", -970.0 ], [ "W", -971.0 ], [ "j", -972.0 ], [ "C", -973.0 ], [ "B", -974.0 ], [ "M", -975.0 ], [ "?", -976.0 ], [ "H", -977.0 ], [ "O", -978.0 ], [ "0", -979.0 ], [ "P", -980.0 ], [ "q", -981.0 ], [ "Y", -982.0 ], [ "N", -983.0 ], [ "L", -984.0 ], [ "D", -985.0 ], [ "1", -986.0 ], [ "E", -987.0 ], [ "G", -988.0 ], [ "z", -989.0 ], [ "F", -990.0 ], [ "R", -991.0 ], [ "-", -992.0 ], [ "2", -993.0 ], [ "J", -994.0 ], [ "U", -995.0 ], [ "9", -996.0 ], [ "K", -997.0 ], [ "5", -998.0 ], [ "3", -999.0 ], [ "V", -1000.0 ], [ "=", -1001.0 ], [ "4", -1002.0 ], [ "8", -1003.0 ], [ "6", -1004.0 ], [ "7", -1005.0 ], [ "!", -1006.0 ], [ "%", -1007.0 ], [ ":", -1008.0 ], [ "Q", -1009.0 ], [ "Z", -1010.0 ], [ "$", -1011.0 ], [ "X", -1012.0 ], [ "\"", -1013.0 ], [ "&", -1014.0 ], [ "*", -1015.0 ], [ "/", -1016.0 ], [ "£", -1017.0 ], [ "+", -1018.0 ], [ "€", -1019.0 ], [ "_", -1020.0 ], [ "^", -1021.0 ], [ "¥", -1022.0 ] ] }, "pretokenizer": { "pretokenizers": [ { "type": "Metaspace", "add_prefix_space": false } ] } }