Instructions to use Abdou/arabic-tashkeel-flan-t5-small with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- Transformers
How to use Abdou/arabic-tashkeel-flan-t5-small with Transformers:
# Load model directly from transformers import AutoTokenizer, AutoModelForMultimodalLM tokenizer = AutoTokenizer.from_pretrained("Abdou/arabic-tashkeel-flan-t5-small") model = AutoModelForMultimodalLM.from_pretrained("Abdou/arabic-tashkeel-flan-t5-small") - Notebooks
- Google Colab
- Kaggle
Update README.md
Browse files
README.md
CHANGED
|
@@ -64,8 +64,6 @@ hadith_texts = [
|
|
| 64 |
]
|
| 65 |
# some Arabic texts
|
| 66 |
arabic_texts = [
|
| 67 |
-
"ุงูุญุฑ ุดุฏูุฏ ูุงูุจุฑุฏ ู
ุดุชุงู ุฅููู",
|
| 68 |
-
"ููู
ุง ุฒุงุฏุช ู
ุนุฑูุชู ุฒุงุฏ ุนูู
ู ุจุฌููู",
|
| 69 |
"ุฅูู
ุง ุงูุฃู
ู
ุงูุฃุฎูุงู ู
ุง ุจููุช ูุฅู ูู
ุฐูุจุช ุฃุฎูุงููู
ุฐูุจูุง",
|
| 70 |
"ูุนุฏ ู
ู ุฃูุจุฑ ุนูู
ุงุก ุงูุฃูุฏูุณ ูุฃูุจุฑ ุนูู
ุงุก ุงูุฅุณูุงู
ุชุตููููุง ูุชุฃููููุง ุจุนุฏ ุงูุทุจุฑูุ ููู ุฅู
ุงู
ุญุงูุธ. ูููู ุธุงูุฑูุ ูู
ุฌุฏุฏ ุงูููู ุจูุ ุจู ู
ุญูู ุงูู
ุฐูุจ ุจุนุฏ ุฒูุงูู ูู ุงูุดุฑู. ูู
ุชููู
ูุฃุฏูุจ ูุดุงุนุฑ ููุณูุงุจุฉ ูุนุงูู
ุจุฑุฌุงู ุงูุญุฏูุซ ููุงูุฏ ู
ุญูู ุจู ูุตูู ุงูุจุนุถ ุจุงููููุณูู ูู
ุง ุนุฏ ู
ู ุฃูุงุฆู ู
ู ูุงู ุจูุฑููุฉ ุงูุฃุฑุถุ ูู
ุง ูุงู ูุฒูุฑ ุณูุงุณู ูุจูู ุฃู
ูุฉุ ุณูู ุทุฑูู ูุจุฐ ุงูุชูููุฏ ูุชุญุฑูุฑ ุงูุฃุชุจุงุนุ ูุงู
ุช ุนููู ุฌู
ุงุนุฉ ู
ู ุงูู
ุงูููุฉ ูุดููุฑุฏ ุนู ูุทูู. ุชููู ูุงุญูุงู ูู ู
ูุฒูู ูู ุฃุฑุถ ุฃุจููู ู
ูุช ููุดู
ุงูู
ุนุฑููุฉ ุจู
ููุชูุฎุงุฑ ุญุงููุงูุ ููู ุนุฒุจุฉ ูุฑูุจุฉ ู
ู ููุจุฉ. ูุฃุตู ุฌุฏู ูุฒูุฏ ูุงุฑุณูุ ุฃุณูู
ูุฃูู ู
ู ุฏุฎู ู
ููู
ุจูุงุฏ ุงูู
ุบุฑุจุ ููุงูุช ุจูุฏูู
ูุฑุทุจุฉ ูููุฏ ุงุจู ุญุฒู
ุจูุง ูู ุณูุฎ ููุงูุฉ ุฑู
ุถุงู ู
ู ุณูุฉ ุฃุฑุจุน ูุซู
ุงููู ูุซูุงุซู
ุงุฆุฉ."
|
| 71 |
]
|
|
@@ -157,18 +155,6 @@ Prediction:
|
|
| 157 |
==========
|
| 158 |
=============== Arabic Texts ===============
|
| 159 |
Input:
|
| 160 |
-
ุงูุญุฑ ุดุฏูุฏ ูุงูุจุฑุฏ ู
ุดุชุงู ุฅููู
|
| 161 |
-
==========
|
| 162 |
-
Prediction:
|
| 163 |
-
ุงูุญูุฑูู ุดูุฏููุฏู ููุงูุจูุฑูุฏู ู
ูุดูุชูุงูู ุฅููููููู
|
| 164 |
-
==========
|
| 165 |
-
Input:
|
| 166 |
-
ููู
ุง ุฒุงุฏุช ู
ุนุฑูุชู ุฒุงุฏ ุนูู
ู ุจุฌููู
|
| 167 |
-
==========
|
| 168 |
-
Prediction:
|
| 169 |
-
ูููููู
ุง ุฒุงุฏูุชู ู
ูุนูุฑูููุชูู ุฒุงุฏู ุนูููู
ูู ุจูุฌูููููู
|
| 170 |
-
==========
|
| 171 |
-
Input:
|
| 172 |
ุฅูู
ุง ุงูุฃู
ู
ุงูุฃุฎูุงู ู
ุง ุจููุช ูุฅู ูู
ุฐูุจุช ุฃุฎูุงููู
ุฐูุจูุง
|
| 173 |
==========
|
| 174 |
Prediction:
|
|
@@ -181,7 +167,7 @@ Prediction:
|
|
| 181 |
ููุนูุฏูู ู
ููู ุฃูููุจูุฑู ุนูููู
ูุงุกู ุงููุฃูููุฏูููุณู ููุฃูููุจูุฑู ุนูููู
ูุงุกู ุงููุฅูุณูููุงู
ู ุชูุตููููููุง ููุชูุฃููููููุง ุจูุนูุฏู ุงูุทููุจูุฑููููุ ูููููู ุฅูู
ูุงู
ู ุญูุงููุธู. ููููููู ุธูุงููุฑููููุ ููู
ูุฌูุฏููุฏู ุงูููููููู ุจูููุ ุจููู ู
ูุญูููู ุงููู
ูุฐูููุจู ุจูุนูุฏู ุฒูููุงูููู ููู ุงูุดููุฑููู. ููู
ูุชููููููู
ู ููุฃูุฏููุจู ููุดูุงุนูุฑู ููููุณููุงุจูุฉู ููุนูุงููู
ู ุจูุฑูุฌูุงูู ุงููุญูุฏููุซู ููููุงููุฏู ู
ูุญูููููู ุจููู ููุตููููู ุงููุจูุนูุถู ุจูุงููููููููุณูููู ููู
ูุง ุนูุฏูู ู
ููู ุฃูููุงุฆููู ู
ููู ููุงูู ุจูููุฑููููููุฉู ุงููุฃูุฑูุถูุ ููู
ูุง ููุงูู ููุฒููุฑู ุณูููุงุณูููู ููุจูููู ุฃูู
ููููุฉูุ ุณููููู ุทูุฑูููู ููุจูุฐู ุงูุชูููููููุฏู ููุชูุญูุฑููุฑู ุงููุฃูุชูุจูุงุนูุ ููุงู
ูุชู ุนููููููู ุฌูู
ูุงุนูุฉู ู
ููู ุงููู
ูุงูููููููุฉู ููุดููุฑููุฏู ุนููู ููุทููููู. ุชูููููููู ููุงุญูููุง ููู ู
ูููุฒููููู ููู ุฃูุฑูุถู ุฃูุจููููููู ู
ูููุชู ููููุดูู
ูู ุงููู
ูุนูุฑููููุฉู ุจูู
ูููุชููุฎูุงุฑู ุญูุงูููููุงุ ูููููู ุนูุฒูุจูุฉู ููุฑููุจูุฉู ู
ููู ููููุจููุฉู. ููุฃูุตููู ุฌูุฏูููู ููุฒููุฏู ููุงุฑูุณููููุ ุฃูุณูููู
ู ููุฃูููููู ู
ููู ุฏูุฎููู ู
ูููููู
ู ุจูููุงุฏู ุงููู
ูุบูุฑูุจูุ ููููุงููุชู ุจูููุฏูููู
ู ููุฑูุทูุจูุฉู ููููููุฏู ุงุจููู ุญูุฒูู
ู ุจูููุง ููู ุณูููุฎู ููููุงููุฉู ุฑูู
ูุถูุงูู ู
ููู ุณูููุฉู ุฃูุฑูุจูุนู ููุซูู
ูุงููููู ููุซูููุงุซูู
ูุงุฆูุฉู.
|
| 182 |
==========
|
| 183 |
```
|
| 184 |
-
As you can see, the model is mostly accurate, but
|
| 185 |
|
| 186 |
By default, the above `vocalize_text()` function is using Beam Search decoding (`num_beams=4`), you can use sampling by setting `do_sample=True` and `temperature` to a value between 0 and 1.
|
| 187 |
|
|
|
|
| 64 |
]
|
| 65 |
# some Arabic texts
|
| 66 |
arabic_texts = [
|
|
|
|
|
|
|
| 67 |
"ุฅูู
ุง ุงูุฃู
ู
ุงูุฃุฎูุงู ู
ุง ุจููุช ูุฅู ูู
ุฐูุจุช ุฃุฎูุงููู
ุฐูุจูุง",
|
| 68 |
"ูุนุฏ ู
ู ุฃูุจุฑ ุนูู
ุงุก ุงูุฃูุฏูุณ ูุฃูุจุฑ ุนูู
ุงุก ุงูุฅุณูุงู
ุชุตููููุง ูุชุฃููููุง ุจุนุฏ ุงูุทุจุฑูุ ููู ุฅู
ุงู
ุญุงูุธ. ูููู ุธุงูุฑูุ ูู
ุฌุฏุฏ ุงูููู ุจูุ ุจู ู
ุญูู ุงูู
ุฐูุจ ุจุนุฏ ุฒูุงูู ูู ุงูุดุฑู. ูู
ุชููู
ูุฃุฏูุจ ูุดุงุนุฑ ููุณูุงุจุฉ ูุนุงูู
ุจุฑุฌุงู ุงูุญุฏูุซ ููุงูุฏ ู
ุญูู ุจู ูุตูู ุงูุจุนุถ ุจุงููููุณูู ูู
ุง ุนุฏ ู
ู ุฃูุงุฆู ู
ู ูุงู ุจูุฑููุฉ ุงูุฃุฑุถุ ูู
ุง ูุงู ูุฒูุฑ ุณูุงุณู ูุจูู ุฃู
ูุฉุ ุณูู ุทุฑูู ูุจุฐ ุงูุชูููุฏ ูุชุญุฑูุฑ ุงูุฃุชุจุงุนุ ูุงู
ุช ุนููู ุฌู
ุงุนุฉ ู
ู ุงูู
ุงูููุฉ ูุดููุฑุฏ ุนู ูุทูู. ุชููู ูุงุญูุงู ูู ู
ูุฒูู ูู ุฃุฑุถ ุฃุจููู ู
ูุช ููุดู
ุงูู
ุนุฑููุฉ ุจู
ููุชูุฎุงุฑ ุญุงููุงูุ ููู ุนุฒุจุฉ ูุฑูุจุฉ ู
ู ููุจุฉ. ูุฃุตู ุฌุฏู ูุฒูุฏ ูุงุฑุณูุ ุฃุณูู
ูุฃูู ู
ู ุฏุฎู ู
ููู
ุจูุงุฏ ุงูู
ุบุฑุจุ ููุงูุช ุจูุฏูู
ูุฑุทุจุฉ ูููุฏ ุงุจู ุญุฒู
ุจูุง ูู ุณูุฎ ููุงูุฉ ุฑู
ุถุงู ู
ู ุณูุฉ ุฃุฑุจุน ูุซู
ุงููู ูุซูุงุซู
ุงุฆุฉ."
|
| 69 |
]
|
|
|
|
| 155 |
==========
|
| 156 |
=============== Arabic Texts ===============
|
| 157 |
Input:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 158 |
ุฅูู
ุง ุงูุฃู
ู
ุงูุฃุฎูุงู ู
ุง ุจููุช ูุฅู ูู
ุฐูุจุช ุฃุฎูุงููู
ุฐูุจูุง
|
| 159 |
==========
|
| 160 |
Prediction:
|
|
|
|
| 167 |
ููุนูุฏูู ู
ููู ุฃูููุจูุฑู ุนูููู
ูุงุกู ุงููุฃูููุฏูููุณู ููุฃูููุจูุฑู ุนูููู
ูุงุกู ุงููุฅูุณูููุงู
ู ุชูุตููููููุง ููุชูุฃููููููุง ุจูุนูุฏู ุงูุทููุจูุฑููููุ ูููููู ุฅูู
ูุงู
ู ุญูุงููุธู. ููููููู ุธูุงููุฑููููุ ููู
ูุฌูุฏููุฏู ุงูููููููู ุจูููุ ุจููู ู
ูุญูููู ุงููู
ูุฐูููุจู ุจูุนูุฏู ุฒูููุงูููู ููู ุงูุดููุฑููู. ููู
ูุชููููููู
ู ููุฃูุฏููุจู ููุดูุงุนูุฑู ููููุณููุงุจูุฉู ููุนูุงููู
ู ุจูุฑูุฌูุงูู ุงููุญูุฏููุซู ููููุงููุฏู ู
ูุญูููููู ุจููู ููุตููููู ุงููุจูุนูุถู ุจูุงููููููููุณูููู ููู
ูุง ุนูุฏูู ู
ููู ุฃูููุงุฆููู ู
ููู ููุงูู ุจูููุฑููููููุฉู ุงููุฃูุฑูุถูุ ููู
ูุง ููุงูู ููุฒููุฑู ุณูููุงุณูููู ููุจูููู ุฃูู
ููููุฉูุ ุณููููู ุทูุฑูููู ููุจูุฐู ุงูุชูููููููุฏู ููุชูุญูุฑููุฑู ุงููุฃูุชูุจูุงุนูุ ููุงู
ูุชู ุนููููููู ุฌูู
ูุงุนูุฉู ู
ููู ุงููู
ูุงูููููููุฉู ููุดููุฑููุฏู ุนููู ููุทููููู. ุชูููููููู ููุงุญูููุง ููู ู
ูููุฒููููู ููู ุฃูุฑูุถู ุฃูุจููููููู ู
ูููุชู ููููุดูู
ูู ุงููู
ูุนูุฑููููุฉู ุจูู
ูููุชููุฎูุงุฑู ุญูุงูููููุงุ ูููููู ุนูุฒูุจูุฉู ููุฑููุจูุฉู ู
ููู ููููุจููุฉู. ููุฃูุตููู ุฌูุฏูููู ููุฒููุฏู ููุงุฑูุณููููุ ุฃูุณูููู
ู ููุฃูููููู ู
ููู ุฏูุฎููู ู
ูููููู
ู ุจูููุงุฏู ุงููู
ูุบูุฑูุจูุ ููููุงููุชู ุจูููุฏูููู
ู ููุฑูุทูุจูุฉู ููููููุฏู ุงุจููู ุญูุฒูู
ู ุจูููุง ููู ุณูููุฎู ููููุงููุฉู ุฑูู
ูุถูุงูู ู
ููู ุณูููุฉู ุฃูุฑูุจูุนู ููุซูู
ูุงููููู ููุซูููุงุซูู
ูุงุฆูุฉู.
|
| 168 |
==========
|
| 169 |
```
|
| 170 |
+
As you can see, the model is mostly accurate, but may make some mistakes, like `ููุนููููู
ู` instead of `ููุนููููู
ู` or `ููููู ููููู ุฎูููุฑู` instead of `ูู ููู ููููู ุฎูููุฑู`.
|
| 171 |
|
| 172 |
By default, the above `vocalize_text()` function is using Beam Search decoding (`num_beams=4`), you can use sampling by setting `do_sample=True` and `temperature` to a value between 0 and 1.
|
| 173 |
|