Result filters

Metadata provider

Language

  • Icelandic

Resource type

Availability

Active filters:

  • Language: Icelandic
Loading...
104 record(s) found

Search results

  • GreynirPackage 3.5.2 (22.10)

    GreynirPackage is a Python 3 package for working with Icelandic natural language text. Greynir can parse text into sentence trees, find lemmas, inflect noun phrases, assign part-of-speech tags and much more. Greynir's sentence trees can inter alia be used to extract information from text, for instance about people, titles, entities, facts, actions and opinions. Greynir uses the Tokenizer package, by the same authors, to tokenize text (see http://hdl.handle.net/20.500.12537/262). More information at https://github.com/icelandic-lt/GreynirEngine and detailed documentation at https://greynir.is/doc/. GreynirPackage er Python 3 pakki sem vinnur með íslenskan texta. Greynir þáttar texta í setningar, lemmar og markar texta, beygir nafnliði og margt fleira. Hægt er að nýta þáttunartrén sem tólið býr til í þeim tilgangi að draga upplýsingar út úr texta, til dæmis um manneskjur, starfstitla, sérnafnaeiningar, staðreyndir, atburði og skoðanir. Greynir notar Tokenizer-pakkann, eftir sömu höfunda, til að tilreiða texta (sjá http://hdl.handle.net/20.500.12537/262). Frekari upplýsingar má finna á https://github.com/icelandic-lt/GreynirEngine og ítarlega skjölun (á ensku) á https://greynir.is/doc/.
  • ABLTagger (Lemmatizer) - 3.1.0

    A neural Lemmatizer for Icelandic. In this submission, you will find a pretrained lemmatizer model for ABLTagger v3.1.0. In this submission we provide a small lemmatizer that accepts as input the tokens and tags from the revised tagset. The lemmatizer achieves an accuracy of 98.3% on MIM-Gold (21.05, cross-validation). Það er minni nákvæmni en Nefnir. For installation, usage, and other instructions see https://github.com/icelandic-lt/POS. You should also check if a newer version is out (see README.md - versions) on CLARIN: - Model files ------------------------------------------------------------------------------------------- Lemmari fyrir íslensku. Í þessum pakka er forþjálfað lemmunar líkan fyrir ABLTagger v3.1.0. Í þessari útgáfu er lítill lemmari sem tekur inn tóka og mörk úr nýja markamengið. Lemmarinn nær 98.3% nákvæmni á MÍM-Gull (21.05, krossprófanir). Það er minni nákvæmni en Nefnir. Fyrir uppsetningar-, notenda- og aðrar leiðbeiningar sjá https://github.com/icelandic-lt/POS. Einnig er gott að athuga þar hvort ný útgáfa sé komin út (sjá README.md - versions) Á CLARIN: - Gögn fyrir líkan
  • ABLTagger (PoS) - 1.0.0

    A Part-of-Speech (PoS) tagger for Icelandic. In this submission, you will find ABLTagger v1.0.0. This is a PoS tagger that works with the revised tagset and achieves an accuracy of 95.59% on MIM-Gold (cross-validation). For additional details, error analysis and categorization of this tagger and other taggers (including a previous version of ABLTagger), see I4 report for milestone (2020) in Language Technology Programme for Icelandic 2019-2023. For the most recent versions, installation, usage, and other instructions see https://github.com/cadia-lvl/POS on CLARIN: - Python wheel, version 1.0.0 - GitHub repository at version 1.0.0 - Model files (tagger and dictionaries) - Docker image, version 1.0.0 ------------------------------------------------------------------------------------------- Markari fyrir íslensku. Í þessum pakka er ABLTagger v.1.0.0. Þetta er markari sem virkar fyrir nýja markamengið og nær 95.59% nákvæmni á MÍM-Gull (krossprófanir). Fyrir nánari upplýsingar, villugreiningu og villuflokkun fyrir þennan markara og aðra (ásamt fyrri útgáfu af þessum markara), sjá I4 skýrslu fyrir vörðu 3 (2020) í Máltækniáætlun fyrir íslensku 2019-2023. Fyrir nýjustu útgáfur, uppsetninga-, notenda- og aðrar leiðbeiningar sjá https://github.com/cadia-lvl/POS Á CLARIN: - Python wheel, útgáfa 1.0.0 - GitHub repository af útgáfu 1.0.0 - Líkan (markari and orðabækur) - Docker mynd, útgáfa 1.0.0
  • TTS Text Processing (22.10)

    ENGLISH: This project provides a TTS textprocessing pipeline for Icelandic. The pipeline includes modules for html parsing, text cleaning, text normalization for TTS, spell and grammar correction, phrasing, and grapheme-to-phoneme (g2p) conversion. Before a text can be fed into a TTS system it has to be converted into the format that was used when training that system. The format can be grapheme-based (i.e. alphabetic characters of the language in question are used as input) or phoneme-based (i.e. a phonetic alphabet like IPA or SAMPA are used as input). The TTS Textprocessing Pipeline for Icelandic offers both possibilities. ÍSLENSKA: Þessi hugbúnaðarpakki inniheldur textavinnslupípu fyrir íslenska talgervla. Pípan samanstendur af vinnslu html-skjala fyrir hljóðbækur, hreinsun texta, textanormun, stafsetningarleiðréttingu, innsetningu á þögnum og sjálfvirkri hljóðritun. Áður en hægt er að senda texta á talgervil þarf að forvinna hann, t.d. skrifa út tölustafi og skammstafanir, merkja inn þagnir og koma textanum að lokum á sama form og þjálfunargögn þess talgervils sem á að lesa textann. Yfirleitt eru talgervlar þjálfaðir á hljóðrituðum textum, þar sem textarnir eru hljóðritaðir skv. hljóðritunarstafrófum eins og IPA eða SAMPA, en einnig geta þeir verið þjálfaðir beint á textum skrifuðum með hefðbundnum bókstöfum. Textavinnslupípan býður upp á báða möguleika og einnig að vinna textann einungis að hluta.