Result filters

Metadata provider

Language

Resource type

Organisation

  • Reykjavík University

Project

  • Language Technology for Icelandic 2019-2023

Active filters:

  • Project: Language Technology for Icelandic 2019-2023
  • Organisation: Reykjavík University
Loading...
7 record(s) found

Search results

  • Icelandic NER API - Ensamble model (21.09)

    A dockerized Named Entity Recognition (NER) API for Icelandic. It uses a the IceBERT language model from Miðeind as its primary model, but it also offers the possibility to use 3 other transformer language models with it ( ELECTRA-base, convbert-small, and multilingual-BERT) and combines them with CombiTagger. They were all fine tuned for NER using MIM-GOLD-NER. IceBERT was the best individual model as it achieves F1-score of ~92.73 on the test set for MIM-GOLD-NER, while the combination of the four, in the form of CombiTagger, achieved F1-score of 93.21. The code for the API is available at https://github.com/icelandic-lt/Icelandic-NER-API and the files for the fine tuned models are available in this submission. Dockerútfærð forritaskil fyrir nafnakennsl (NER) á íslensku. Þau notast við IceBERT mállíkan frá Miðeind sem sitt megin líkan, en þau bjóða líka upp á möguleikann að láta IceBERT vinna með 3 öðrum líkönum (ELECTRA-base, convbert-small og multilingual-BERT). Þau hafa öll verið fínstillt fyrir NER með nafnakennslamálheildinni MIM-GOLD-NER. Ef við skoðum hvert líkan fyrir sig, þá er IceBERT líkanið best, en það nær 92.73 í F1, á meðn CombiTagger nær 93.21 í F1. Forritunarkóðinn fyrir forritaskilinu eru aðgengileg hérna: https://github.com/icelandic-lt/Icelandic-NER-API og skrárnar fyrir fínstilltu líkönin má finna í þessari færslu.
  • Talrómur Utils

    This is a collection of utilities for Text-to-speech (TTS) development using the Talrómur corpus. This collection includes: - Alignments for all the voices in Talrómur created with the Montreal Forced Aligner - Train, evaluation and test splits for all the voices in Talrómur - Two baseline TTS models and vocoder models Þetta er hjálparpakki fyrir Talrómsgagnasettið. Pakkinn inniheldur allt nauðsynlegt til að þróa og keyra talgervla búna til með Talrómi.
  • Webrice extension (22.09)

    The Webrice plugin is a software add-on that gives access to people to listen to web pages instead of reading them. This chrome browser extension changes Icelandic text to speech. Webrice-viðbótin er hugbúnaðarforrit sem hjálpar notendum að velja texta og hlusta á hann í staðinn fyrir að lesa. Þessi Chrome-viðbót breytir íslenskum textan í tal.
  • Punctuation model (20.09)

    A python package that punctuates Icelandic text. The input data is unpunctuated text and punctuated text is returned. The user can choose between two punctuation models, a BERT-based Transformer and a bidirectional RNN ([Punctuator 2](www.github.com/ottokart/punctuator2)) in Tensorflow 2. [Icelandic] Python-pakki sem greinarmerkjasetur íslenskan texta. Inntakið er á formi ógreinarmerkjasetts texta og greinarmerkjasettum texta er skilað. Notandinn getur valið milli tveggja greinarmerkjasetningalíkana, annars vegar umbreytis sem byggir á BERT og tvístefnu-endurkvæmnisneti ([Punctuator 2](www.github.com/ottokart/punctuator2)) í Tensorflow 2.
  • MOSI: TTS evaluation tool (22.01)

    EN: MOSI is a text-to-speech (TTS) evaluation platform. The platform is focused on listening tests. Organizers can upload audio clips to be evaluated using Mean opinion score (MOS), AB or ABX setups. The platform allows the organizers to arrange and plan the evaluations, customize the setup, send out invite links to participants and view and download the results. A detailed setup description can be found in README.md and a user guide can be found in HOW_TO_USE.md. IS: MOSI er tól/vettvangur þar sem hljóðgerving er metin. MOSI er búinn til fyrir hlustunarpróf. Notendur MOSA geta hlaðið upp hljóðklippum og notað MOS-, AB- eða ABX-fyrirkomulag. MOSI gerir skipuleggjendum kleift að skipuleggja kannanir, stilla þær eftir sinni hentisemi, senda boðshlekki til þátttakenda og skoða og hlaða niður niðurstöðum. Uppsetningarleiðbeiningar má finna í readme.md og notkunarleiðbeiningar má finna í HOW_TO_USE.md.
  • Icelandic NER API - ELECTRA-base model (21.05)

    A dockerized Named Entity Recognition (NER) API for Icelandic. It uses a ELECTRA-base language model, that has been fine tuned for NER using MIM-GOLD-NER. It achieves F1-score of ~91.9 on the test set for MIM-GOLD-NER. The code for the API is available at https://github.com/icelandic-lt/Icelandic-NER-API and the files for the fine tuned model are available in this submission. Dockerútfærð forritaskil fyrir nafnakennsl (NER) á íslensku. Það notast við ELECTRA-base mállíkan, sem hefur verið fínstillt fyrir NER með nafnakennslamálheildinni MIM-GOLD-NER. Líkanið nær u.þ.b. 91.9 fyrir prófunarmengi MIM-GOLDöNER. Forritunarkóðinn fyrir forritaskilinu eru aðgengileg hérna: https://github.com/icelandic-lt/Icelandic-NER-API og skrárnar fyrir fínstillta líkanið má finna í þessari færslu.
  • Webrice extension (22.01)

    The Webrice plugin is a software add-on that gives access to people to listen to web pages instead of reading them. This chrome browser extension changes Icelandic text to speech. Webrice viðbótin er hugbúnaðarforrit sem hjálpar notendum að velja texta og hlusta á hann í staðinn fyrir að lesa. Þessi Chrome viðbót breytir íslenskan textan í tal.