Abstract
Ushbu maqolada o‘zbek tili milliy korpusini rivojlantirishda neyron tarmoqlari asosidagi Word Embedding modellarining o‘rni nazariy jihatdan tahlil qilinadi. O‘zbek tilining agglutinativ xususiyatlari hisobga olingan holda, so‘zlar o‘rtasidagi semantik bog‘liqliklarni matematik ifodalash va ularni vektor fazoda modellashtirishga oid ilmiy yondashuvlar ko‘rib chiqiladi. Maqolada mavjud NLP metodlari va ularning o‘zbek tili korpusiga tatbiq etish imkoniyatlari yoritiladi.
References
Mo‘minova L. R. O‘zbek tili nazariyasi. Toshkent, 2020.
2. Karimov S. Kompyuter lingvistikasi asoslari. Toshkent: Fan, 2023.
3. Goodfellow I., Bengio Y., Courville A. Deep Learning. MIT Press, 2016.
4. Bojanowski P. va boshq. 2017. Enriching word vectors with subword information.
5. Zokirov F. Matematik tilshunoslik. Toshkent, 2021.
6. Mikolov T. va boshq. 2013. Word Representations in Vector Space.
7. Abdullayev A. O‘zbek tili korpusi. Toshkent, 2022.
8. Jurafsky D., Martin J. Speech and Language Processing. 2023.
9. Mirzayev M. Raqamli lingvistika istiqbollari. 2022.
10. Devlin J. va boshq. BERT modeli. 2019.