Spanish_NeoIberianNewDesign

Sleeping

App Files Files Community

LoloSemper commited on Apr 29

Commit

7fb5740

verified ·

1 Parent(s): 5efb67d

Upload 2 files

Browse files

Files changed (2) hide show

LEXICON_v82_IBERIAN.csv.gz +3 -0
app.py +21 -9

LEXICON_v82_IBERIAN.csv.gz ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:06bcd502995157e9d3a185e7a482e21c6647ef00d28de679ee84d34696d4390a
+size 12673243

app.py CHANGED Viewed

@@ -46,6 +46,13 @@ def _cand(*names):
 # Prioriza los “master/surface-ready”; luego retrocompatibles
 CSV_BI = _cand(
     "LEXICON_v75_IBERIAN.csv.gz",
     "LEXICON_v74_IBERIAN.csv.gz",
     "LEXICON_v73_IBERIAN.csv.gz",
@@ -503,26 +510,31 @@ def load_bi_strict_and_diagnose():
                     if ni not in NIPHRASE2ES:
                         NIPHRASE2ES[ni] = (es_orig, pid)
-                # ES→NI — prioridad: N > V; dentro de V: PRS/PST > IMP/SBJ
                 pos = (r.get(POS_COL) or "").strip() if POS_COL else ""
                 morph = (r.get(MORPH_COL) or "").strip() if MORPH_COL else ""
                 _MORPH_PRIO = {"PRS":10,"PST":9,"IPFV":8,"FUT":7,"COND":6,
                                "INF":5,"GER":4,"PART":3,"SBJ":2,"SBJ_IPFV":1,"IMP":0}
                 if es in ES2NI:
                     dup_es += 1
                     old_pos = ES2NI_POS.get(es, "")
                     old_morph = ES2NI_MORPH.get(es, "")
                     replace = False
-                    if pos == "N" and old_pos == "V":
-                        ES2NI_VERB[es] = ES2NI[es]  # guardar alternativa verbal
-                        replace = True  # sustantivo > verbo
-                    elif pos == "V" and old_pos == "V":
-                        new_p = _MORPH_PRIO.get(morph, -1)
-                        old_p = _MORPH_PRIO.get(old_morph, -1)
-                        if new_p > old_p:
                             ES2NI_VERB[es] = ES2NI[es]  # guardar alternativa verbal
                             replace = True  # PRS > IMP, etc.
-                    elif pos == "V" and old_pos == "N":
                         ES2NI_VERB[es] = (ni_orig, pid)  # el verbo es la alternativa
                     if replace:
                         ES2NI[es] = (ni_orig, pid)

 # Prioriza los “master/surface-ready”; luego retrocompatibles
 CSV_BI = _cand(
+    "LEXICON_v82_IBERIAN.csv.gz",
+    "LEXICON_v81_IBERIAN.csv.gz",
+    "LEXICON_v80_IBERIAN.csv.gz",
+    "LEXICON_v79_IBERIAN.csv.gz",
+    "LEXICON_v78_IBERIAN.csv.gz",
+    "LEXICON_v77_IBERIAN.csv.gz",
+    "LEXICON_v76_IBERIAN.csv.gz",
     "LEXICON_v75_IBERIAN.csv.gz",
     "LEXICON_v74_IBERIAN.csv.gz",
     "LEXICON_v73_IBERIAN.csv.gz",
                     if ni not in NIPHRASE2ES:
                         NIPHRASE2ES[ni] = (es_orig, pid)
+                # ES→NI — prioridad: ADJ > N > V; dentro de V: PRS/PST > IMP/SBJ
                 pos = (r.get(POS_COL) or "").strip() if POS_COL else ""
                 morph = (r.get(MORPH_COL) or "").strip() if MORPH_COL else ""
                 _MORPH_PRIO = {"PRS":10,"PST":9,"IPFV":8,"FUT":7,"COND":6,
                                "INF":5,"GER":4,"PART":3,"SBJ":2,"SBJ_IPFV":1,"IMP":0}
+                _POS_PRIO = {"ADJ":3, "N":2, "V":1}
                 if es in ES2NI:
                     dup_es += 1
                     old_pos = ES2NI_POS.get(es, "")
                     old_morph = ES2NI_MORPH.get(es, "")
                     replace = False
+                    new_p = _POS_PRIO.get(pos, 0)
+                    old_p = _POS_PRIO.get(old_pos, 0)
+                    if new_p > old_p:
+                        # Mayor prioridad POS → reemplazar (ADJ > N > V)
+                        if old_pos == "V":
                             ES2NI_VERB[es] = ES2NI[es]  # guardar alternativa verbal
+                        replace = True
+                    elif pos == "V" and old_pos == "V":
+                        new_m = _MORPH_PRIO.get(morph, -1)
+                        old_m = _MORPH_PRIO.get(old_morph, -1)
+                        if new_m > old_m:
+                            ES2NI_VERB[es] = ES2NI[es]
                             replace = True  # PRS > IMP, etc.
+                    elif pos == "V" and old_pos in ("N", "ADJ"):
                         ES2NI_VERB[es] = (ni_orig, pid)  # el verbo es la alternativa
                     if replace:
                         ES2NI[es] = (ni_orig, pid)