Spaces:

fcasadei
/

AURA-chatbot

Paused

App Files Files Community

fcasadei commited on Jul 8, 2025

Commit

dcc758a

verified ·

1 Parent(s): ff4a790

Upload app.py

Browse files

Files changed (1) hide show

app.py +190 -0

app.py ADDED Viewed

	@@ -0,0 +1,190 @@

+import streamlit as st
+from ragpipeline import (RAGPipeline,Retriever,ChatBot)
+import tempfile
+import pandas as pd
+from textutils import ParagraphDocumentProcessor, DocumentProcessor,WholeTextDocumentProcessor
+from HFChatbot import HFBot
+import os
+###########################################
+# MAIN CON STREAMLIT
+###########################################
+def main():
+    UPLOAD_DIR = "/tmp/"
+    os.makedirs(UPLOAD_DIR, exist_ok=True)
+    codice_tabella = f"<table><tr><td>💡AURA:</td><td> AI-Driven Unified Regulatory Audit</td></tr></table>"
+    st.markdown(codice_tabella, unsafe_allow_html=True)
+    if "faiss_builder" not in st.session_state:
+        ragpipeline = RAGPipeline(numero_frammenti=10)
+        st.session_state["faiss_builder"] = ragpipeline
+    else:
+        ragpipeline = st.session_state["faiss_builder"]
+    if "storico_domande" not in st.session_state:
+        st.session_state["storico_domande"] = []
+    if "indice_creato" not in st.session_state:
+        st.session_state["indice_creato"] = False
+    modelliLLM = [
+        'Almawave/Velvet-2B',
+        'Almawave/Velvet-14B',
+        'mistralai/Mistral-7B-Instruct-v0.1',
+    ]
+    modelliOllama = [
+        'deepseek-r1:1.5b',
+        'qwen2.5:7b',
+        'deepseek-r1:7b',
+        'llama3.2:3b',
+        'Almawave/Velvet:2B',
+        'Almawave/Velvet:14b',
+        'mistral:latest',
+        "vaiton/minerva",
+        'qwen2.5:0.5b',
+        'qwen3:4b',
+        'minerva',
+        'nemo',
+        'deepseek-r1:14b',
+        'qwen3:14b',
+        'phi4-mini-reasoning',
+        'gemma3:12b',
+        ]
+    modello_scelto = st.selectbox("Seleziona un modello:", modelliLLM)
+    st.write(f"Hai selezionato: {modello_scelto}")
+    st.title("Suddivisione in paragrafi")
+    docprocessor_options = {
+        "ParagraphDocumentProcessor": ParagraphDocumentProcessor(),
+        "WholeText": WholeTextDocumentProcessor()
+    }
+    selected_docprocessor = st.selectbox("Divisione in paragrafi", docprocessor_options.keys())
+    docprocessor = docprocessor_options[selected_docprocessor]
+    st.write(f"Hai selezionato: **{selected_docprocessor}**")
+    ragpipeline.docprocessor = docprocessor
+    if not st.session_state["indice_creato"]:
+        st.subheader("Carica l'atto principale (Determinazione)")
+        main_pdf = st.file_uploader("Carica 1 file PDF - Determinazione", type=["pdf"], key="main_pdf")
+        if main_pdf:
+            st.session_state["main_pdf_nome"] = main_pdf.name
+        st.subheader("Carica eventuali Allegati PDF multipli")
+        other_pdfs = st.file_uploader("Carica allegati (puoi caricare più PDF)",
+                                    type=["pdf"],
+                                    accept_multiple_files=True,
+                                    key="allegati_pdf")
+        if st.button("Crea indice FAISS"):
+            if main_pdf is not None:
+                try:
+                    save_path = os.path.join(UPLOAD_DIR, main_pdf.name)
+                    with open(save_path, "wb") as f:
+                        f.write(main_pdf.read())
+                    st.success(f"✅  Determinazione caricata con successo! File salvato in: `{save_path}`")
+                    ragpipeline.aggiungi_file_pdf(save_path)
+                except Exception as e:
+                    st.error(f"❌ Errore nel salvataggio del file: {e}")
+            else:
+                st.warning("Nessun PDF di Determinazione caricato.")
+            if other_pdfs:
+                for uploaded_file in other_pdfs:
+                    with tempfile.NamedTemporaryFile(delete=False, suffix=".pdf", dir=UPLOAD_DIR) as tmp_file:
+                        tmp_file.write(uploaded_file.read())
+                        tmp_path = tmp_file.name
+                        ragpipeline.aggiungi_file_pdf(tmp_path)
+                        st.subheader(f"Caricato file {tmp_file.name}")
+                st.success("Allegati caricati con successo!")
+            else:
+                st.info("Nessun allegato caricato.")
+            ragpipeline.crea_indice()
+            st.success("Indice FAISS generato e caricato.")
+            st.session_state["indice_creato"] = True
+            frammenti_recuperati =ragpipeline.attributi_frammenti
+            for frammento_recuperato in frammenti_recuperati:
+                RAGPipeline.dump_excel(dizionario=frammento_recuperato, filename="frammentiChatbot.xlsx")
+    if st.session_state["indice_creato"]:
+        with st.form(key="domanda_form"):
+            domanda = st.text_area("Inserisci la domanda", key="domanda_input")
+            istruzione = st.text_area("Inserisci le istruzioni", key="istruzione_input")
+            submit_button = st.form_submit_button("Analizza atto")
+        if submit_button:
+            if domanda.strip().upper() == "FINE":
+                st.stop()
+            #cb = ChatBot(model_name="flaollama", model_orig=modello_scelto)
+            cb  = HFBot(model_name=modello_scelto)
+            ret = Retriever(
+                indice=ragpipeline.indice,
+                sentence_transformer_model=ragpipeline.sentence_transformer_model,
+                query=domanda + istruzione,
+                documenti=ragpipeline.documenti,
+                frammenti_indicizzati=ragpipeline.frammenti_indicizzati,
+                attributi_frammenti=ragpipeline.attributi_frammenti
+            )
+            ret.esegui_query(top_k=3)
+            risposta = cb.generate(
+                query=domanda,
+                relevant_docs=ret.passaggi_rilevanti,
+                attributi_frammenti_rilevanti=ret.attributi_rilevanti,
+                istruzioni=istruzione
+            )
+            st.session_state.storico_domande.append((modello_scelto, domanda, istruzione, risposta))
+            st.markdown(
+                f"<p><strong>Domanda:</strong> {domanda}  <br/>"
+                f"<strong>Istruzioni:</strong> <em>{istruzione}</em><br/><br/>"
+                f"<strong>Risposta:</strong><em> {risposta}</em></p>",
+                unsafe_allow_html=True
+            )
+            id_frammenti_recuperati =  ":".join(sorted(set(elemento['id'] for elemento in ret.attributi_rilevanti)))
+            dump  = {
+                 'timestamp': ragpipeline.timestamp,
+                "modello": cb.model_orig,
+                "documenti": st.session_state.get("main_pdf_nome", "non disponibile"),
+                "file_recuperati": "",
+                "file_gold": "",
+                "frammenti_recuperati":id_frammenti_recuperati,
+                "frammenti_gold": "",
+                "domanda":domanda,
+                "istruzioni":istruzione,
+                "risposta_gold": " ",
+                "risposta":cb.pulisci_risposta(risposta)}
+            RAGPipeline.dump_excel(dizionario=dump,filename="dumpChatbot.xlsx")
+    if st.session_state.storico_domande:
+        st.markdown("---")
+        st.subheader("Storico delle domande analizzate")
+        for idx, (mymod, q, inst, resp) in enumerate(st.session_state.storico_domande, 1):
+            st.markdown(
+                f"""
+                **{idx}. Domanda:** {q}<br/>
+                <em>Modello: </em>{mymod}<br/>
+                <em>Istruzioni:</em> {inst}<br/><br/>
+                <strong>Risposta:</strong> {resp}<br/>
+                """,
+                unsafe_allow_html=True
+            )
+if __name__ == "__main__":
+    main()