{ "hyperparameters": { "data_file": "/home/metythorn/konai/services/ocr-service/data/processed/text-recognition/ocr_dataset_v2.txt", "img_height": 128, "use_stn": true, "stn_fiducial_points": 20, "augment": true, "max_decode_len": 166, "quiet": false, "device": "cuda:1", "img_width": 384, "batch_size": 128, "lr": 8e-05, "epochs": 12, "d_model": 512, "nhead": 8, "num_layers": 6, "backbone": "resnet34", "checkpoint_dir": "checkpoints_base", "model_size": "base", "config_path": "checkpoints_base/config.json" }, "vocab": { "specials": [ "", "", "" ], "char2idx": { "": 0, "": 1, "": 2, " ": 3, "!": 4, "\"": 5, "#": 6, "$": 7, "%": 8, "&": 9, "'": 10, "(": 11, ")": 12, "*": 13, "+": 14, ",": 15, "-": 16, ".": 17, "/": 18, "0": 19, "1": 20, "2": 21, "3": 22, "4": 23, "5": 24, "6": 25, "7": 26, "8": 27, "9": 28, ":": 29, ";": 30, "<": 31, "=": 32, ">": 33, "?": 34, "@": 35, "A": 36, "B": 37, "C": 38, "D": 39, "E": 40, "F": 41, "G": 42, "H": 43, "I": 44, "J": 45, "K": 46, "L": 47, "M": 48, "N": 49, "O": 50, "P": 51, "Q": 52, "R": 53, "S": 54, "T": 55, "U": 56, "V": 57, "W": 58, "X": 59, "Y": 60, "Z": 61, "[": 62, "\\": 63, "]": 64, "^": 65, "_": 66, "`": 67, "a": 68, "b": 69, "c": 70, "d": 71, "e": 72, "f": 73, "g": 74, "h": 75, "i": 76, "j": 77, "k": 78, "l": 79, "m": 80, "n": 81, "o": 82, "p": 83, "q": 84, "r": 85, "s": 86, "t": 87, "u": 88, "v": 89, "w": 90, "x": 91, "y": 92, "z": 93, "{": 94, "|": 95, "}": 96, "~": 97, "£": 98, "©": 99, "«": 100, "®": 101, "°": 102, "»": 103, "×": 104, "ß": 105, "â": 106, "ō": 107, "ƒ": 108, "α": 109, "ក": 110, "ខ": 111, "គ": 112, "ឃ": 113, "ង": 114, "ច": 115, "ឆ": 116, "ជ": 117, "ឈ": 118, "ញ": 119, "ដ": 120, "ឋ": 121, "ឌ": 122, "ឍ": 123, "ណ": 124, "ត": 125, "ថ": 126, "ទ": 127, "ធ": 128, "ន": 129, "ប": 130, "ផ": 131, "ព": 132, "ភ": 133, "ម": 134, "យ": 135, "រ": 136, "ល": 137, "វ": 138, "ឝ": 139, "ឞ": 140, "ស": 141, "ហ": 142, "ឡ": 143, "អ": 144, "ឣ": 145, "ឥ": 146, "ឦ": 147, "ឧ": 148, "ឨ": 149, "ឩ": 150, "ឪ": 151, "ឫ": 152, "ឬ": 153, "ឭ": 154, "ឮ": 155, "ឯ": 156, "ឰ": 157, "ឱ": 158, "ឲ": 159, "ឳ": 160, "ា": 161, "ិ": 162, "ី": 163, "ឹ": 164, "ឺ": 165, "ុ": 166, "ូ": 167, "ួ": 168, "ើ": 169, "ឿ": 170, "ៀ": 171, "េ": 172, "ែ": 173, "ៃ": 174, "ោ": 175, "ៅ": 176, "ំ": 177, "ះ": 178, "ៈ": 179, "៉": 180, "៊": 181, "់": 182, "៌": 183, "៍": 184, "៎": 185, "៏": 186, "័": 187, "៑": 188, "្": 189, "។": 190, "៕": 191, "៖": 192, "ៗ": 193, "៘": 194, "៙": 195, "៚": 196, "៛": 197, "០": 198, "១": 199, "២": 200, "៣": 201, "៤": 202, "៥": 203, "៦": 204, "៧": 205, "៨": 206, "៩": 207, "​": 208, "‌": 209, "‐": 210, "–": 211, "“": 212, "”": 213, "•": 214, "…": 215, "‹": 216, "›": 217, "−": 218, "∞": 219, "▼": 220, "▾": 221, "●": 222, "⚫": 223, "✅": 224, "伍": 225, "和": 226, "德": 227, "連": 228, "郑": 229, ";": 230, "🎉": 231 }, "idx2char": { "0": "", "1": "", "2": "", "3": " ", "4": "!", "5": "\"", "6": "#", "7": "$", "8": "%", "9": "&", "10": "'", "11": "(", "12": ")", "13": "*", "14": "+", "15": ",", "16": "-", "17": ".", "18": "/", "19": "0", "20": "1", "21": "2", "22": "3", "23": "4", "24": "5", "25": "6", "26": "7", "27": "8", "28": "9", "29": ":", "30": ";", "31": "<", "32": "=", "33": ">", "34": "?", "35": "@", "36": "A", "37": "B", "38": "C", "39": "D", "40": "E", "41": "F", "42": "G", "43": "H", "44": "I", "45": "J", "46": "K", "47": "L", "48": "M", "49": "N", "50": "O", "51": "P", "52": "Q", "53": "R", "54": "S", "55": "T", "56": "U", "57": "V", "58": "W", "59": "X", "60": "Y", "61": "Z", "62": "[", "63": "\\", "64": "]", "65": "^", "66": "_", "67": "`", "68": "a", "69": "b", "70": "c", "71": "d", "72": "e", "73": "f", "74": "g", "75": "h", "76": "i", "77": "j", "78": "k", "79": "l", "80": "m", "81": "n", "82": "o", "83": "p", "84": "q", "85": "r", "86": "s", "87": "t", "88": "u", "89": "v", "90": "w", "91": "x", "92": "y", "93": "z", "94": "{", "95": "|", "96": "}", "97": "~", "98": "£", "99": "©", "100": "«", "101": "®", "102": "°", "103": "»", "104": "×", "105": "ß", "106": "â", "107": "ō", "108": "ƒ", "109": "α", "110": "ក", "111": "ខ", "112": "គ", "113": "ឃ", "114": "ង", "115": "ច", "116": "ឆ", "117": "ជ", "118": "ឈ", "119": "ញ", "120": "ដ", "121": "ឋ", "122": "ឌ", "123": "ឍ", "124": "ណ", "125": "ត", "126": "ថ", "127": "ទ", "128": "ធ", "129": "ន", "130": "ប", "131": "ផ", "132": "ព", "133": "ភ", "134": "ម", "135": "យ", "136": "រ", "137": "ល", "138": "វ", "139": "ឝ", "140": "ឞ", "141": "ស", "142": "ហ", "143": "ឡ", "144": "អ", "145": "ឣ", "146": "ឥ", "147": "ឦ", "148": "ឧ", "149": "ឨ", "150": "ឩ", "151": "ឪ", "152": "ឫ", "153": "ឬ", "154": "ឭ", "155": "ឮ", "156": "ឯ", "157": "ឰ", "158": "ឱ", "159": "ឲ", "160": "ឳ", "161": "ា", "162": "ិ", "163": "ី", "164": "ឹ", "165": "ឺ", "166": "ុ", "167": "ូ", "168": "ួ", "169": "ើ", "170": "ឿ", "171": "ៀ", "172": "េ", "173": "ែ", "174": "ៃ", "175": "ោ", "176": "ៅ", "177": "ំ", "178": "ះ", "179": "ៈ", "180": "៉", "181": "៊", "182": "់", "183": "៌", "184": "៍", "185": "៎", "186": "៏", "187": "័", "188": "៑", "189": "្", "190": "។", "191": "៕", "192": "៖", "193": "ៗ", "194": "៘", "195": "៙", "196": "៚", "197": "៛", "198": "០", "199": "១", "200": "២", "201": "៣", "202": "៤", "203": "៥", "204": "៦", "205": "៧", "206": "៨", "207": "៩", "208": "​", "209": "‌", "210": "‐", "211": "–", "212": "“", "213": "”", "214": "•", "215": "…", "216": "‹", "217": "›", "218": "−", "219": "∞", "220": "▼", "221": "▾", "222": "●", "223": "⚫", "224": "✅", "225": "伍", "226": "和", "227": "德", "228": "連", "229": "郑", "230": ";", "231": "🎉" } } }