FU-Lab. 2025.05.19.-2025.05.23

опубликовал Öньö Лав в 14:53 21.05.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.05.19.-2025.05.23

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2025. №21); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  3. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 62, 63-64, 66, 77, 78).
  4. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Еремей пророклӧн небӧг", "Еремейлӧн бӧрданкыв", "Езекель пророклӧн небӧг", "Даниил пророклӧн небӧг 1-14").
  5. Озвучка коми пословиц для образовательного портала "Коми кыв", обработка первой порции озвученных текстов в программе Audacity, сохранение их в отдельные mp3 файлы, загрузка на сервер и создание ссылкок с сайта komikyv.com.
  6. Размещение в онлайн-библиотеке "Коми гижӧд" произведения: "Е. Цыпанов. И Сордйыв грездын олысьяскӧд тшӧтш «тӧдмасьӧны» талун Эстонияын".
  7. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer текста учебного издания на удмуртском языке "В. А. Тетюрев. Естествознание. Начальной школаын ньылетӥ классаз дышетон книга. Кыкетӥ люкетэз (1935)" для дальнейшего выравнивания с коми текстом в параллельном корпусе пермских языков.
  8. Пополнение списка онлайн корпусов на ресурсе wiki.fu-lab.ru
  9. Восстановление стандартного редактора текстов на сайте онлайн библиотеки "Коми гижӧд".
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности. 
  12. Проведение культурно-просветительного мероприятия "Коми язык в интернет пространстве" (2025-05-21).
FU-Lab. 2025.05.12.-2025.05.16

опубликовал Öньö Лав в 22:52 15.05.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.05.12.-2025.05.16

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2025. №20); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  3. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 60, 61, 76).
  4. Корректирование текстов газеты «Коми му» за 1991 год (апрель) №№ 39, 40, 41, 42, 43, 44, 45, 46, 47, 48-49, 50, 51, 52.
  5. Пополнение основного корпуса коми языка материалами, обработанными в лаборатории за последние недели.
  6. Обновление списка онлайн переводчиков на ресурсе wiki.fu-lab.ru
  7. Распространение комиязычного контента в соц. сетях.
  8. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  9. Участие в стратегической сессии "Информационные технологии и языки народов России", организованной Федеральным агентством по делам национальностей (г. Москва, 14-15 мая 2025 года). Выступление с докладом на тему "Опыт создания русско-коми языкового корпуса как текстовой базы для переводчика".
FU-Lab. 2025.05.05.-2025.05.07

опубликовал Öньö Лав в 21:59 15.05.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.05.05.-2025.05.07
 

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2025. №18, 19); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  3. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№59).
  4. Корректирование текстов газеты «Коми му» за 1991 год (март) № 26, 27, 28, 29-30, 31, 32, 33, 34, 35, 36, 37, 38.
  5. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов журнала "Комі му" (1925. №№ 1, 2; 1926. №№ 9, 10), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус.
  6. Продолжение работы по переводу лексической базы для мобильного приложения по коми языку.
  7. Обновление списка языковых корпусов на ресурсе wiki.fu-lab.ru
  8. Консультирование коллег из УИИЯЛ УдмФИЦ УрО РАН по выравниванию стихотворных текстов при создании параллельного корпуса.
  9. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2025.04.28.-2025.04.30

опубликовал Öньö Лав в 21:53 15.05.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.04.28.-2025.04.30

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 52, 57, 58).
  3. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Екклезиаст, 8-12", "Песнь песней", "Книга пророка Исаии 1-58).
  4. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. № 22), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  5. Возобновление работы по переводу лексической базы для мобильного приложения по коми языку.
  6. Распространение комиязычного контента в соц. сетях.
2025ʼ косму тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 22:01 24.04.2025

24.03.2025–25.04.2025

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№ 37-38, 43-51, 53-56).
  3. Корректирование текстов газеты «Коми му» за 1991 год (№№ 14-25).
  4. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2025. №12-16), журналов "Би кинь" (2025. №№2, 3), "Чушканзі" (2025. №№ 2, 3), "Йӧлӧга" (2025. №№ 2, 3), "Войвыв кодзув" (2025. №№ 2, 3); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Извлечение текстов из pdf файла журнала "Би кинь" за 2006 г. (№№ 4, 6-8, 12); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Ездра", "Неемия", "Эсфирь", "Иов", "Псалтырь", "Притчи Соломоновы", "Екклезиаст, 1-7").
  7. Размещение произведений в онлайн-библиотеке "Коми гижӧд": А. Мишарина стих-я "Вильышпозъяс", "Куш муа няйтыс...", "Кӧдзыд пӧльыд Коми муад...", "Турӧб", "Асыв", "Сёр ар"; А. Ракин стих-е "Педӧр дядь"; В. Напалков стих-е "Кутла китӧ"; Е. Цыпанов статья "Быдӧнлы тӧдса кывъяс нянь да сов"; В. Лодыгин стих-е "Васьӧ касьӧ"; П. Бушенев стих-я "Рӧмпӧштан", "Тувъясигӧн", "Сир", "Коктӧм часі", "Повзьӧдіс"; В. Бабин стих-я "Мути", "«Пӧжасьысь»", "Колысь", "Ньӧбасьысь", "Коми гижӧд": Алёна Ельцова стихотворения "Увгӧ турӧб...", "Тӧвся вӧрын...", "Тӧрыт лунтыр буаліс...", "Зумышӧсь зэв коз пуяс...", Елена Афанасьева стих-я "Лым вылын чышъян", "Сёрмӧм лым"; Алёна Старцева стих-е "Ме тэнад кывбур, а тэ менам шылад..."; Алёна Ельцова стих-е "Алӧй дзоридз — войтурун..."; Нина Обрезкова стих-я "Муслунлӧн паметьысь...", "Мӧдысьсӧ тадзи жӧ ола...", "Чӧдъя гожӧм, чӧдъя вӧтъяс...", "Ёма", "Кывъясыс сэки вӧліны нин...", "Волім муслунӧдзыс...", "Тувччис мортыс му вылас ...", "Олӧмыс ньӧжмӧдас олӧмтӧ сы вылӧ...", "Сабри пинь коласад мый сӧмын оз сюрлы...", "Мынӧмаӧсь мамлӧн...", "Гажтӧмтча-ӧ ме гортсьым...", "Августнас карын...", "Чӧдъя гожӧм, чӧдъя вӧтъяс..."; Ольга Баженова стих-я "Кадыс ытва моз нуӧ-ньылалӧ...", "Чарла кывйӧн менӧ вундылісны…"; Зарни Люся рассказ "Шогтӧ он вузав, шудтӧ он ньӧб"; Евгений Цыпанов статья "Позьӧ шуны мӧд кывъясӧн да небыдджыка"; Анжелика Елфимова стих-я "Вӧтӧй вӧлі кисьмӧм гожӧма...", "Быд йылӧмлӧн аслас кось...", "Ӧткалуна", "Асывнас тотшкӧдчис тулыс...", "Кӧть кодкӧ тӧдӧ, мыйла тайӧ...", "Кӧть кодкӧ тӧдӧ, мыйла тайӧ...", "Пета потшӧс бокӧ...",  Иван Ногиев рассказ "Коді нӧ шышкыс?", Зарни Люся рассказ "Сюсь Сюзь", Серафим Попов поэма "Воркутаса бушков".
  8. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельному номеру журнала "Войвыв кодзув" (2025 № 2,3),  отдельных страниц по книжным изданиям на коми языке: "Меным югыдыс тырмис... (А. Шебыревлӧн 2024ʼ вося небӧг)", "Синва пӧль (Елена Афанасьевалӧн 2024ʼ вося небӧг)", "Менам нэм (И. А. Куратовлӧн 2024ʼ вося небӧг)", "Батьяс йылысь висьт (Нина Куратовалӧн 2024ʼ вося небӧг)", "Нимкодь лоны капитанöн! (Алёна Старцевалӧн 2024ʼ вося небӧг)", "Кышакылысь кад (Нина Обрезковалӧн 2024ʼ вося небӧг)", "Потандорса сьыланкывъяс (З. Остаповалӧн 2024ʼ вося небӧг)", "Лелькуйтчанкывъяс (З. Остаповалӧн 2024ʼ вося небӧг)", "Кывпесанъяс (З. Остаповалӧн 2024ʼ вося небӧг)", "Эскыны ловлы (И. А. Куратовлӧн 2024ʼ вося небӧг)", "Кыр йылын бӧрдіс гудӧк (Елена Козловалӧн 2024ʼ вося небӧг)", "Сёркни (Михаил Лебедевлӧн 2024ʼ вося небӧг)", "Пера-багатыр (2024ʼ вося небӧг)", "Шондібанӧй, Коми муӧй (В. Напалковлӧн 2022' вося небӧг)", "Аттьӧ тэныд, чужан сиктӧй, му вылас мый эм! (М. Матевалӧн 2022' вося небӧг)", "Путшкымдінса важ вераӧ эскысьяслӧн традицияяс да обрядъяс (М. Матевалӧн 2024ʼ вося небӧг)", "Олӧм пасъяс (М. Матевалӧн 2019' вося небӧг)", "Олӧм лӧсасъяс (М. Матевалӧн 2019' вося небӧг)", "Олӧм войтъяс (М. Матевалӧн 2019' вося небӧг)", "Сьӧлӧманым ловъяӧсь век... (2020ʼ вося небӧг)", "Художествоа коми литература челядь садйын лыддьӧм-видлалӧм (2003ʼ вося небӧг)", "Сёрнитыштам! (2022' вося небӧг)".
  9. Сборка и выравнивание текстов wiki-ресурса ruwiki.ru на коми и русском языках (выравнивание абзацев, проверка орфографии, выявление новой лексики и расстановка языковых тэгов. Оформление комиязычных текстов для пополнения лексической базы Корпуса коми языка.
  10. Выравнивание коми-зырянского (1936) и коми-пермяцкого (1937) переводов текста учебника: "Г. И. Иванов. География частей света и важнейших стран (без СССР)" с русскоязычным оригиналом. Пополнение таблицы параллельных предложений по данному изданию на сайте "Коми лингвистика".
  11. Приобретение, распознавание и вычитка в программе ABBYY FineReader и обработка  в программе LibreOffice Writer текстов русскоязычного оригинала учебника: "С. Варжанский и Л. Синицкий. География капиталистических стран. Учебник для средней школы. 6-й год обучения. Издание второе" (1934).  Выравнивание по предложениям русского текста с коми переводом 1933 года в программе WinMerge.
  12. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцкого издания на латинице: "С. Варжанскӧй да Л. Синицкӧй. Капиталистическӧй странаэзлӧн география. Шӧрӧт школа понда велӧтчан книга. 6-ӧт велӧтчан во" (1933).
  13. Постатейная разбивка PDF файла сборника "Пермистика 20" (2025). Загрузка файлов со статьями на сервер. Создание оглавления для данного сборника на сайте "Пермистика" со ссылками на отдельные статьи.
  14. Распространение комиязычного контента в соц. сетях.
  15. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2025.04.21.-2025.04.25

опубликовал Öньö Лав в 20:58 24.04.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.04.21.-2025.04.25

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№ 48-51, 55, 56).
  3. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №16); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Распространение комиязычного контента в соц. сетях.
  5. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2025.04.14.-2025.04.18

опубликовал Öньö Лав в 13:23 22.04.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.04.14.-2025.04.18

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№ 47, 53, 54).
  3. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №15); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Приобретение, распознавание и вычитка в программе ABBYY FineReader и обработка  в программе LibreOffice Writer текстов русскоязычного оригинала учебника: "С. Варжанский и Л. Синицкий. География капиталистических стран. Учебник для средней школы. 6-й год обучения. Издание второе" (1934).  Выравнивание по предложениям русского текста с коми переводом 1933 года в программе WinMerge.
  5. Сборка и выравнивание текстов wiki-ресурса ruwiki.ru на коми и русском языках (выравнивание абзацев, проверка орфографии, выявление новой лексики и расстановка языковых тэгов). Оформление комиязычных текстов для пополнения лексической базы Корпуса коми языка.
  6. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Художествоа коми литература челядь садйын лыддьӧм-видлалӧм (2003ʼ вося небӧг)", "Сёрнитыштам! (2022' вося небӧг)".
  7. Размещение произведений в онлайн-библиотеке "Коми гижӧд": Зарни Люся рассказ "Сюсь Сюзь", Серафим Попов поэма "Воркутаса бушков".
  8. Распространение комиязычного контента в соц. сетях.
  9. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2025.04.07.-2025.04.11

опубликовал Öньö Лав в 21:41 14.04.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.04.07.-2025.04.11

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№ 45, 46).
  3. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №13,14); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Сборка и выравнивание текстов wiki-ресурса ruwiki.ru на коми и русском языках (выравнивание абзацев, проверка орфографии, выявление новой лексики и расстановка языковых тэгов. Оформление комиязычных текстов для пополнения лексической базы Корпуса коми языка.
  5. Размещение в онлайн-библиотеке "Коми гижӧд" рассказа "Коді нӧ шышкыс?" автора Иван Ногиев.
  6. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Псалтырь, 40-151", "Притчи Соломоновы", "Екклезиаст, 1-7").
  7. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцкого издания на латинице: "С. Варжанскӧй да Л. Синицкӧй. Капиталистическӧй странаэзлӧн география. Шӧрӧт школа понда велӧтчан книга. 6-ӧт велӧтчан во" (1933).
  8. Постатейная разбивка PDF файла сборника "Пермистика 20" (2025). Загрузка файлов со статьями на сервер. Создание оглавления для данного сборника на сайте "Пермистика" со ссылками на отдельные статьи.
  9. Распространение комиязычного контента в соц. сетях.
  10. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2025.03.31.-2025.04.04

опубликовал Öньö Лав в 23:31 06.04.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.03.31.-2025.04.04

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№ 44).
  3. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №13), журналов "Би кинь" (2025. №3), "Чушканзі" (2025. №№ 2,3), "Йӧлӧга" (2025. №№ 2,3), "Войвыв кодзув" (2025. № 2,3); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельному номеру журнала "Войвыв кодзув" (2025 № 2,3),  отдельных страниц по книжным изданиям на коми языке: "Меным югыдыс тырмис... (А. Шебыревлӧн 2024ʼ вося небӧг)", "Синва пӧль (Елена Афанасьевалӧн 2024ʼ вося небӧг)", "Менам нэм (И. А. Куратовлӧн 2024ʼ вося небӧг)", "Батьяс йылысь висьт (Нина Куратовалӧн 2024ʼ вося небӧг)", "Нимкодь лоны капитанöн! (Алёна Старцевалӧн 2024ʼ вося небӧг)", "Кышакылысь кад (Нина Обрезковалӧн 2024ʼ вося небӧг)", "Потандорса сьыланкывъяс (З. Остаповалӧн 2024ʼ вося небӧг)", "Лелькуйтчанкывъяс (З. Остаповалӧн 2024ʼ вося небӧг)", "Кывпесанъяс (З. Остаповалӧн 2024ʼ вося небӧг)", "Эскыны ловлы (И. А. Куратовлӧн 2024ʼ вося небӧг)", "Кыр йылын бӧрдіс гудӧк (Елена Козловалӧн 2024ʼ вося небӧг)", "Сёркни (Михаил Лебедевлӧн 2024ʼ вося небӧг)", "Пера-багатыр (2024ʼ вося небӧг)", "Шондібанӧй, Коми муӧй (В. Напалковлӧн 2022' вося небӧг)", "Аттьӧ тэныд, чужан сиктӧй, му вылас мый эм! (М. Матевалӧн 2022' вося небӧг)", "Путшкымдінса важ вераӧ эскысьяслӧн традицияяс да обрядъяс (М. Матевалӧн 2024ʼ вося небӧг)", "Олӧм пасъяс (М. Матевалӧн 2019' вося небӧг)", "Олӧм лӧсасъяс (М. Матевалӧн 2019' вося небӧг)", "Олӧм войтъяс (М. Матевалӧн 2019' вося небӧг)", "Сьӧлӧманым ловъяӧсь век... (2020ʼ вося небӧг)".
  5. Размещение произведений в онлайн-библиотеке "Коми гижӧд": Елена Афанасьева стих-я "Лым вылын чышъян", "Сёрмӧм лым"; Алёна Старцева стих-е "Ме тэнад кывбур, а тэ менам шылад..."; Алёна Ельцова стих-е "Алӧй дзоридз — войтурун..."; Нина Обрезкова стих-я "Муслунлӧн паметьысь...", "Мӧдысьсӧ тадзи жӧ ола...", "Чӧдъя гожӧм, чӧдъя вӧтъяс...", "Ёма", "Кывъясыс сэки вӧліны нин...", "Волім муслунӧдзыс...", "Тувччис мортыс му вылас ...", "Олӧмыс ньӧжмӧдас олӧмтӧ сы вылӧ...", "Сабри пинь коласад мый сӧмын оз сюрлы...", "Мынӧмаӧсь мамлӧн...", "Гажтӧмтча-ӧ ме гортсьым...", "Августнас карын...", "Чӧдъя гожӧм, чӧдъя вӧтъяс..."; Ольга Баженова стих-я "Кадыс ытва моз нуӧ-ньылалӧ...", "Чарла кывйӧн менӧ вундылісны…"; Зарни Люся рассказ "Шогтӧ он вузав, шудтӧ он ньӧб"; Евгений Цыпанов статья "Позьӧ шуны мӧд кывъясӧн да небыдджыка"; Анжелика Елфимова стих-я "Вӧтӧй вӧлі кисьмӧм гожӧма...", "Быд йылӧмлӧн аслас кось...", "Ӧткалуна", "Асывнас тотшкӧдчис тулыс...", "Кӧть кодкӧ тӧдӧ, мыйла тайӧ...", "Кӧть кодкӧ тӧдӧ, мыйла тайӧ...", "Пета потшӧс бокӧ...".
  6. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Ездра", "Неемия", "Эсфирь", "Иов", "Псалтырь, 1-39").
  7. Распространение комиязычного контента в соц. сетях.
  8. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2025.03.24.-2025.03.28

опубликовал Öньö Лав в 13:56 03.04.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.03.24.-2025.03.28

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№ 37, 38, 43).
  3. Корректирование текстов газеты «Коми му» за 1991 год (январь) № 14-25.
  4. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №12) и журнала "Би кинь" (2025. №2); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Извлечение текстов из pdf файла журнала "Би кинь" за 2006 г. (№№ 4, 6-8, 12); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Размещение произведений в онлайн-библиотеке "Коми гижӧд": А. Мишарина стих-я "Вильышпозъяс", "Куш муа няйтыс...", "Кӧдзыд пӧльыд Коми муад...", "Турӧб", "Асыв", "Сёр ар"; А. Ракин стих-е "Педӧр дядь"; В. Напалков стих-е "Кутла китӧ"; Е. Цыпанов статья "Быдӧнлы тӧдса кывъяс нянь да сов"; В. Лодыгин стих-е "Васьӧ касьӧ"; П. Бушенев стих-я "Рӧмпӧштан", "Тувъясигӧн", "Сир", "Коктӧм часі", "Повзьӧдіс"; В. Бабин стих-я "Мути", "«Пӧжасьысь»", "Колысь", "Ньӧбасьысь", "Коми гижӧд": Алёна Ельцова стихотворения "Увгӧ турӧб...", "Тӧвся вӧрын...", "Тӧрыт лунтыр буаліс...", "Зумышӧсь зэв коз пуяс...".
  7. Выравнивание коми-зырянского (1936) и коми-пермяцкого (1937) переводов текста учебника: "Г. И. Иванов. География частей света и важнейших стран (без СССР)" с русскоязычным оригиналом. Пополнение таблицы параллельных предложений по данному изданию на сайте "Коми лингвистика".
  8. Распространение комиязычного контента в соц. сетях.
2025ʼ вося медводдза кварталысь отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 13:39 03.04.2025

2024.12.23.-2025.03.21.

2. Работа в рамках пополнения параллельного корпуса (kv-ru) и текстовой базы машинного переводчика:

2.1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.

2.2. Редактирование эталон-сета для МКАО "Яндекс".

2.3. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Бытие", "Исход", "Левит", "Числа", "Второзаконие", "Иисуса Навина", "Судьи", "Руфь", "Царств, 1-4", "Паралипоменон, 1-2").

2.4. Сборка и выравнивание текстов новой интернет-энциклопедии ruwiki.ru на коми и русском языках.

2.5. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer текстов электроного pdf-издания "Книга Почёта" (2024) на коми и русском языках (выравнивание абзацев, проверка орфографии, выявление новой лексики и расстановка языковых тэгов), разделение коми и русских текстов по разным файлам, разбивка текстов на строки и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Создание фотокопий номеров газеты «Югыд туй» за первое полугодие 1990 года и газеты «Коми му» за 1991 год.

3.2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка) текстов номеров газет «Югыд туй» за 1990 г. (№№ 1, 2, 145, 153, 154, 155, 156) и «Коми му» за 1991 г. (№ 1-36, 39-42).

3.3. Корректирование текстов газеты «Югыд туй» за 1990 г. (№ 152, 153, 154, 155, 156) и «Коми му» за 1991 год (№ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13).

3.4. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) текстов журнала "Би кинь" (2004. №2; 2007. №11; 2010. №9; 2017. №№4, 9).

3.5. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2024. №52, 2025, №№1-11), журналов  "Йӧлӧга" (2024. № 12, 2025. № 1), "Чушканзі" (2024 №12; 2025 №1), "Би кинь" (2024. №12; 2025. №1), "Войвыв кодзув" (2024. №12, 2025. № 1); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).

3.6. Распознавание в программе ABBYY FineReader комиязычного издания "Е. А. Цыпанов. Перым коми гижӧд кыв" (1999).

3.7. Извлечение текстов из редакторской pdf копии издания А. Мишарина "Кармылькйын гожӧм" (2013), обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).

3.8. Оформление комиязычных текстов wiki-ресурса ruwiki.ru в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики и расстановка языковых тэгов).

3.9. Исправление ошибки в поисковой системе корпуса, связанной с поиском по лемме слов с прописной буквы.

3.10. Сборка и метеразметка текстов нового перевода Библии на коми язык.

3.11. Добавление в корпус коми языка текстов, обработанных за отчетный период.

Объём корпуса коми языка за отчетный период возрос на 953 465 единиц и к 2025-03-21 составляет 88 067 522 словоупотреблений.

4. Текстовое пополнение молодцовского корпуса:

4.1. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926 №№ 17, 18, 19, 20, 21), их обработка в программе LibreOffice Writer и загрузка в молодцовский корпус.

5. Пополнение онлайн библиотеки "Коми гижӧд":

5.1. Размещение произведений в онлайн-библиотеке "Коми гижӧд": А. Мишарин "Кармылькйын гожӧм", "Чепӧлышъяс".

5.2. Размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд" 5 номеров газеты "Комі ԍікт" за 1926 год (№№ 17-21).

6. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

6.1. Библиографическое пополнение станицы "Коми му (газет; юриндалысь) 2020-2024" справочного wiki-ресурса "Коми тӧданін".

6.2. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельному номеру журнала "Войвыв кодзув" (2024 № 12).

6.3. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Чужан муыд быдӧнлы колӧ (Э. Поляковалӧн 2024ʼ вося небӧг)", "Кӧдзыд пӧль (А. Сукгоевалӧн 2024ʼ вося небӧг)", "Ылӧ кольӧм вояс (Е. А. Игушевлӧн 2024ʼ вося небӧг)", "Коми Республикаса Почёт книга (2024ʼ вося небӧг)",  "Кармылькйын гожӧм (А. Мишаринлӧн 2013ʼ вося небӧг)".

6.4. Создание и заполнение wiki-страниц с оглавлением по номерам газеты "Комі ԍікт" за 1926 год (№№ 17-21) в онлайн-справочнике "Коми тӧданін".

7. Работа с лексической базой FU-Lab:

7.1. Внесение правок в текст "Коми-пермяцко-русского словаря" на сайте "Онлайн-словари FU-Lab".

8. Преобразования на образовательном портале komikyv.ru

8.1. Загрузка видеороликов по коми грамматике на хостинги Rutube и VK Видео.  

8.2. Заменна ссылок на видеоролики с сайта komikyv.ru. Вместо Youtube они теперь ведут на Rutube.

9. Создание мультиязычного корпуса по пермским языкам:

9.1. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "В. Н. Львов. Мый му пытшкын?" (1935), "В. Н. Львов. Музэгалӧммез" (1935), "В. Н. Львов. Вулканнэз" (1936), "В. А. Тетюрев. Природатӧдӧм. 1 тор. Куимӧт велӧтчан во" (1934), "В. А. Тетюрев. Природатӧдӧм. Мӧдік тор. Нёльӧт велӧтчан во" (1933), "И. Борисов, Е. Марова, Л. Павличева, В. Тетюрев. Природатӧдӧм. Етша велӧтчӧм йӧзлӧ" (1933), "П. Веприков, В. Ившин. Быдмас. Кыдз сія олӧ, кыдз керӧм да кытшӧм сетӧ польза" (1934), "В. Г. Фридман. Мый вылын видзсьӧ му" (1934), "Терехова Л. Г, Эрдели В. Г. География. Медодзза тор. Куимӧт велӧтчан во" (1934), "Терехова Л. Г, Эрдели В. Г. География. Мӧдік тор. Нёльӧт класслӧ велӧтчан книга" (1934), "М. Потёмкин да П. Терехов. География. Учӧт грамотаа школаэз понда велӧтчан книга" (1934), "Д-р Ф. А. Копылов. Любознательнӧйезлӧн клуб" (1934), "А. А. Шибанов да мӧд. Природа тӧдмалан книга. Куимӧт во" (1932), "Н. А. Репина. Природа тӧдмалан книга. IV во велӧтчиссезлӧ" (1932), "Г. И. Фалеев, А. В. Перышкин. Физика. Шӧрӧт школа понда велӧтчан книга. 5-ӧт велӧтчан во" (1933), "Л. Г. Терехова, В. Г. Эрдели. География. Медодзза часть. Медодзза школа понда куимӧт класслӧ велӧтчан книга" (1936), "Л. Г. Терехова, В. Г. Эрдели. География. Мӧдік часть. Медодзза школа понда нёльӧт класслӧ велӧтчан книга" (1936),  "А. С. Барков, А. А. Половинкин. Физическӧй география. Шӧрӧт школа понда витӧт класслӧ велӧтчан книга" (1936),  "Н. Н. Баранский. ССР Союзлӧн физическӧй география. Шӧрӧт школа понда сизимӧт класслӧ велӧтчан книга" (1936), "Г. И. Иванов. География свет часттезлӧн да важнейшӧй странаэзлӧн (СССР-тӧг). Небытса шӧрӧт да шӧрӧт школа понда 6-ӧт класслӧ велӧтчан книга" (1936).

9.2. Выравнивание переводов текста учебника: "Г. И. Иванов. География частей света и важнейших стран (без СССР)" на коми-зырянском (1936) и коми-пермяцком (1937) языках. Создание таблицы параллельных предложений по данному изданию на сайте "Коми лингвистика".

9.3. Вычитка варианта на современной орфографии и корректирование в программе LibreOffice Writer удмуртского текста учебника "Н. Н. Баранский. СССР географи. Шор ёзо школаын 6 но 7 араз дышетон книга. Нырысетӥ люкетэз" (1933).

10. По лингвистическому ресурсу "Коми кывтӧдӧм":

10.1. Сканирование, создание pdf копий и размещение на сайте "Коми кывтӧдӧм" лингвистических изданий: "Г. В. Федюнева. Коми местоимение: к проблеме формального варьирования в языке" (2000), "Г. В. Федюнева. Местоимения 1-го и 2-го лица в пермских языках: исторические параллели" (2006), Г. В. Федюнева. Указательные местоимения и их производные в пермских языках" (2007).

11. Пополнение словарной базы средства проверки правописания Hunspell:

11.1. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.

12. Иное

12.1. Тестирование аудиозаписывающего оборудования в ИЯЛИ КНЦ УрО РАН для дальнейшей работы по созданию аудиокорпуса.

12.2. Работа по обучению практиканта, направленного КРАГСиУ, работе по распознаванию текстов в программе ABBYY FineReader, извлечению текстов из pdf-файлов.  

12.3. Обновление презентации по продуктам и ресурсам Лаборатории FU-Lab для показа на «Республиканском фестивале мастер-классов среди педагогических работников Республики Коми по сохранению коми языка, культуры и традиций».

12.4. Распространение комиязычного контента в соц. сетях.

12.5. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

2025ʼ рака тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 0:27 24.03.2025

24.02.202521.03.2025

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№  24, 25, 27, 28, 29-30, 31, 39, 32, 33, 40, 41, 34, 35, 36, 42).
  3. Редактирование текстов газеты «Югыд туй» за 1990 г. (№ 152, 153, 154, 155, 156) и «Коми му» за 1991 год (№ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13).
  4. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №8-11); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Извлечение текстов из редакторской pdf копии издания А. Мишарина "Кармылькйын гожӧм" (2013)
  6. Размещение произведений в онлайн-библиотеке "Коми гижӧд": А. Мишарин "Кармылькйын гожӧм", "Чепӧлышъяс";
  7. Заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по книжному изданию на коми языке: "Кармылькйын гожӧм (А. Мишаринлӧн 2013ʼ вося небӧг)";
  8. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) текстов журнала "Би кинь" (2004. №2; 2007. №11; 2010. №9; 2017. №№4, 9).
  9. Продолжение сборки и выравнивания текстов wiki-ресурса ruwiki.ru на коми и русском языках. Оформление комиязычных текстов для пополнения лексической базы Корпуса коми языка (выравнивание абзацев, проверка орфографии, выявление новой лексики и расстановка языковых тэгов).
  10. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Судьи", "Руфь", "Царств, 1-4", "Паралипоменон, 1-2").
  11. Работа по обучению практиканта, направленного КРАГСиУ, работе по распознаванию текстов в программе ABBYY FineReader, извлечению текстов из pdf-файлов.
  12. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. №№ 20, 21), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  13. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "Г. И. Иванов. География свет часттезлӧн да важнейшӧй странаэзлӧн (СССР-тӧг). Небытса шӧрӧт да шӧрӧт школа понда 6-ӧт класслӧ велӧтчан книга" (1936).
  14. Выравнивание переводов текста учебника: "Г. И. Иванов. География частей света и важнейших стран (без СССР)" на коми-зырянском (1936) и коми-пермяцком (1937) языках. Создание таблицы параллельных предложений по данному изданию на сайте "Коми лингвистика".
  15. Тестирование аудиозаписывающего оборудования в ИЯЛИ КНЦ УрО РАН для дальнейшей работы по созданию аудиокорпуса.        
  16. Обновление презентации по продуктам и ресурсам Лаборатории FU-Lab для показа на «Республиканском фестивале мастер-классов среди педагогических работников Республики Коми по сохранению коми языка, культуры и традиций».
  17. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2025.03.17.-2025.03.21

опубликовал Öньö Лав в 23:47 23.03.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.03.17.-2025.03.21

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№ 34, 35, 36, 42).
  3. Редактирование текстов газеты «Коми му» за 1991 год (январь) № 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13.
  4. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №11); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. №№ 20, 21), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  6. Извлечение текстов из редакторской pdf копии издания А. Мишарина "Кармылькйын гожӧм" (2013)
  7. Размещение произведений в онлайн-библиотеке "Коми гижӧд": А. Мишарин "Кармылькйын гожӧм", "Чепӧлышъяс";
  8. Заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по книжному изданию на коми языке: "Кармылькйын гожӧм (А. Мишаринлӧн 2013ʼ вося небӧг)";
  9. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) текстов журнала "Би кинь" (2004. №2; 2007. №11; 2010. №9; 2017. №№4, 9).
  10. Работа по обучению практиканта, направленного КРАГСиУ, работе по распознаванию текстов в программе ABBYY FineReader, извлечению текстов из pdf-файлов.
  11. Выравнивание переводов текста учебника: "Г. И. Иванов. География частей света и важнейших стран (без СССР)" на коми-зырянском (1936) и коми-пермяцком (1937) языках. Создание таблицы параллельных предложений по данному изданию на сайте "Коми лингвистика".
  12. Распространение комиязычного контента в соц. сетях
FU-Lab. 2025.03.10.-2025.03.14

опубликовал Öньö Лав в 12:02 17.03.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.03.10.-2025.03.14

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 32, 33, 40, 41).
  3. Извлечение из pdf файла текстов свежего номера газеты «Коми му» (2025. №10); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов)
  4. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Царств, 3-4", "Паралипоменон, 1-2").
  5. Завершение распознавания и вычитки в программе ABBYY FineReader текстов коми-пермяцкого издания на латинице: "Г. И. Иванов. География свет часттезлӧн да важнейшӧй странаэзлӧн (СССР-тӧг). Небытса шӧрӧт да шӧрӧт школа понда 6-ӧт класслӧ велӧтчан книга" (1936).
  6. Обновление презентации по продуктам и ресурсам Лаборатории FU-Lab для показа на «Республиканский фестиваль мастер-классов среди педагогических работников Республики Коми по сохранению коми языка, культуры и традиций».
  7. Работа по обучению практиканта, направленного КРАГСиУ, работе по распознаванию текстов в программе ABBYY FineReader и публикации художественных произведений в ресурсе http://komikyv.org.
  8. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2025.03.03.-2025.03.07

опубликовал Öньö Лав в 17:25 10.03.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.03.03.-2025.03.07

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 29-30, 31, 39).
  3. Редактирование текстов газеты «Югыд туй» за 1990 г. (№ 152, 153, 154, 155, 156).
  4. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №9); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Продолжение распознавания и вычитки в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "Г. И. Иванов. География свет часттезлӧн да важнейшӧй странаэзлӧн (СССР-тӧг). Небытса шӧрӧт да шӧрӧт школа понда 6-ӧт класслӧ велӧтчан книга" (1936).
  6. Работа по обучению практиканта, направленного КРАГСиУ, работе по распознаванию текстов в программе ABBYY FineReader.
  7. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2025.02.24.-2025.02.28

опубликовал Öньö Лав в 11:04 02.03.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.02.24.-2025.02.28

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 24, 25, 27, 28).
  3. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №8); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Продолжение сборки и выравнивания текстов wiki-ресурса ruwiki.ru на коми и русском языках. Оформление комиязычных текстов для пополнения лексической базы Корпуса коми языка (выравнивание абзацев, проверка орфографии, выявление новой лексики и расстановка языковых тэгов).
  5. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Судьи", "Руфь", "Царств, 1-2").
  6. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "Г. И. Иванов. География свет часттезлӧн да важнейшӧй странаэзлӧн (СССР-тӧг). Небытса шӧрӧт да шӧрӧт школа понда 6-ӧт класслӧ велӧтчан книга" (1936).
  7. Тестирование аудиозаписывающего оборудования в ИЯЛИ КНЦ УрО РАН для дальнейшей работы по созданию аудиокорпуса.
  8. Распространение комиязычного контента в соц. сетях.
2025ʼ урасьӧм тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 11:05 23.02.2025

2025.01.27.-2025.02.21

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Редактирование эталон-сета для МКАО "Яндекс".
  3. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка  в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 11, 12, 18, 19, 20, 21, 22, 23, 26).
  4. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2025. №4-7), журналов  "Йӧлӧга" (2024. № 12, 2025. № 1), "Чушканзі" (2024 №12; 2025 №1), "Би кинь" (2024. №12; 2025. №1), "Войвыв кодзув" (2024. №12, 2025. № 1); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов)
  5. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer текстов электроного pdf-издания "Книга Почёта" (2024) на коми и русском языках (выравнивание абзацев, проверка орфографии, выявление новой лексики и расстановка языковых тэгов), разделение коми и русских текстов по разным файлам, разбивка текстов на строки и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.
  6. Сборка и выравнивание текстов wiki-ресурса ruwiki.ru на коми и русском языках (выравнивание абзацев, проверка орфографии, выявление новой лексики и расстановка языковых тэгов). Оформление комиязычных текстов для пополнения лексической базы Корпуса коми языка.
  7. Продолжение распознавания в программе ABBYY FineReader комиязычного издания "Е. А. Цыпанов. Перым коми гижӧд кыв" (1999).
  8. Завершение сборки текстов нового перевода текстов Ветхого завета на коми язык, метаразметка и загрузка в корпус коми языка.
  9. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Бытие", "Исход", "Левит", "Числа", "Второзаконие", "Иисуса Навина").
  10. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "Г. И. Фалеев, А. В. Перышкин. Физика. Шӧрӧт школа понда велӧтчан книга. 5-ӧт велӧтчан во" (1933), "Л. Г. Терехова, В. Г. Эрдели. География. Медодзза часть. Медодзза школа понда куимӧт класслӧ велӧтчан книга" (1936), "Л. Г. Терехова, В. Г. Эрдели. География. Мӧдік часть. Медодзза школа понда нёльӧт класслӧ велӧтчан книга" (1936),  "А. С. Барков, А. А. Половинкин. Физическӧй география. Шӧрӧт школа понда витӧт класслӧ велӧтчан книга" (1936),  "Н. Н. Баранский. ССР Союзлӧн физическӧй география. Шӧрӧт школа понда сизимӧт класслӧ велӧтчан книга" (1936).
  11. Библиографическое пополнение станицы "Коми му (газет; юриндалысь) 2020-2024" справочного wiki-ресурса "Коми тӧданін"
  12. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельному номеру журнала "Войвыв кодзув" (2024 № 12).
  13. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Коми Республикаса Почёт книга (2024ʼ вося небӧг)".
  14. Загрузка видеороликов по коми грамматике на хостинги Rutube и VK Видео.  
  15. Заменна ссылок на видеоролики с сайта komikyv.ru. Вместо Youtube они теперь ведут на Rutube.
  16. Тестирование аудиозаписывающего оборудования в ИЯЛИ КНЦ УрО РАН для дальнейшей работы по созданию аудиокорпуса.
  17. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  18. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  19. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2025.02.17.-2025.02.21

опубликовал Öньö Лав в 19:52 21.02.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.02.17.-2025.02.21

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Сборка и выравнивание текстов wiki-ресурса ruwiki.ru на коми и русском языках (выравнивание абзацев, проверка орфографии, выявление новой лексики и расстановка языковых тэгов). Оформление комиязычных текстов для пополнения лексической базы Корпуса коми языка.
  3. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №7); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Распознавание и вычитка в программе ABBYY FineReader и обработка LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 21, 22, 23) в программе LibreOffice Writer.
  5. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Числа", "Второзаконие", "Иисуса Навина").
  6. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "Н. Н. Баранский. ССР Союзлӧн физическӧй география. Шӧрӧт школа понда сизимӧт класслӧ велӧтчан книга" (1936).
  7. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  8. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  9. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2025.02.10.-2025.02.14

опубликовал Öньö Лав в 20:07 15.02.2025

​В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.02.10.-2025.02.14

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Завершение редактирования эталон-сета для МКАО "Яндекс".
  3. Продолжение загрузки видеороликов по коми грамматике на хостинги Rutube и VK Видео и заменны ссылок на видеоролики с сайта komikyv.ru. 
  4. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Бытие", "Исход", "Левит").
  5. Тестирование аудиозаписывающего оборудования в ИЯЛИ КНЦ УрО РАН для дальнейшей работы по созданию аудиокорпуса.
  6. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №6); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  7. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка  в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 20, 26).
  8. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer текстов электроного pdf-издания "Книга Почёта" (2024) на коми и русском языках (выравнивание абзацев, проверка орфографии, выявление новой лексики и расстановка языковых тэгов), разделение коми и русских текстов по разным файлам, разбивка текстов на строки и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.
  9. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Коми Республикаса Почёт книга (2024ʼ вося небӧг)".
  10. Библиографическое пополнение станицы "Коми му (газет; юриндалысь) 2020-2024" справочного wiki-ресурса "Коми тӧданін"
  11. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "А. С. Барков, А. А. Половинкин. Физическӧй география. Шӧрӧт школа понда витӧт класслӧ велӧтчан книга" (1936).
  12. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  14. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2025.02.03.-2025.02.07

опубликовал Öньö Лав в 18:22 13.02.2025

​В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.02.03.-2025.02.07

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Продолжение редактирования эталон-сета для МКАО "Яндекс".
  3. Загрузка видеороликов по коми грамматике на хостинги Rutube и VK Видео.
  4. Заменна ссылок на видеоролики с сайта komikyv.ru. Вместо Youtube они теперь ведут на Rutube.
  5. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2025. №5), журналов  "Йӧлӧга" (2024. № 12, 2025. № 1), "Чушканзі" (2024 №12; 2025 №1), "Би кинь" (2024. №12; 2025. №1), "Войвыв кодзув" (2025. № 1); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов)
  6. Распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текста газеты «Коми му» (1991. № 19).
  7. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "Л. Г. Терехова, В. Г. Эрдели. География. Мӧдік часть. Медодзза школа понда нёльӧт класслӧ велӧтчан книга" (1936).
  8. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  9. Распространение комиязычного контента в соц. сетях.
     
FU-Lab. 2025.01.27.-2025.01.31

опубликовал Öньö Лав в 19:17 30.01.2025

​В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.01.27.-2025.01.31

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, метаразметка) текстов газеты «Коми му» (1991. № 11, 12, 18).
  3. Извлечение из pdf файла текстов свежего номера газеты «Коми му» (2025. №4); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Извлечение из pdf файла текстов свежего номера журнала "Войвыв кодзув" (2024. № 12); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельному номеру журнала "Войвыв кодзув" (2024 № 12).
  6. Редактирование эталон-сета для МКАО "Яндекс".
  7. Завершение сборки текстов нового перевода текстов Ветхого завета на коми язык, метаразметка и загрузка в корпус коми языка.
  8. Продолжение распознавания в программе ABBYY FineReader комиязычного издания "Е. А. Цыпанов. Перым коми гижӧд кыв" (1999).
  9. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "Г. И. Фалеев, А. В. Перышкин. Физика. Шӧрӧт школа понда велӧтчан книга. 5-ӧт велӧтчан во" (1933), "Л. Г. Терехова, В. Г. Эрдели. География. Медодзза часть. Медодзза школа понда куимӧт класслӧ велӧтчан книга" (1936).
  10. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
2025ʼ тӧвшӧр тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 11:55 24.01.2025

2024.12.23.-2025.01.24.

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание фотокопий номеров газеты «Югыд туй» за первое полугодие 1990 года и газеты «Коми му» за 1991 год.
  3. Распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка) текстов номеров газет «Югыд туй» (1990. №№ 1, 2, 145, 153, 154, 155, 156) и «Коми му» (1990. № 1-10, 14-17).
  4. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2024. №52, 2025, №№1-3); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Начало распознавания в программе ABBYY FineReader комиязычного издания "Е. А. Цыпанов. Перым коми гижӧд кыв" (1999).
  6. Сборка для корпуса коми языка текстов нового перевода Библии на коми язык (книги "Олӧм", "Петӧм", "Левит", "Лыд", "Индӧд", "Нав Исус", "Ёрдысьяс", "Руфа", "Ӧксыяслӧн небӧгъяс", "Кад небӧгъяс").
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926 №№ 17, 18, 19), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  8. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "В. Н. Львов. Мый му пытшкын?" (1935), "В. Н. Львов. Музэгалӧммез" (1935), "В. Н. Львов. Вулканнэз" (1936), "В. А. Тетюрев. Природатӧдӧм. 1 тор. Куимӧт велӧтчан во" (1934), "В. А. Тетюрев. Природатӧдӧм. Мӧдік тор. Нёльӧт велӧтчан во" (1933), "И. Борисов, Е. Марова, Л. Павличева, В. Тетюрев. Природатӧдӧм. Етша велӧтчӧм йӧзлӧ" (1933), "П. Веприков, В. Ившин. Быдмас. Кыдз сія олӧ, кыдз керӧм да кытшӧм сетӧ польза" (1934), "В. Г. Фридман. Мый вылын видзсьӧ му" (1934), "Терехова Л. Г, Эрдели В. Г. География. Медодзза тор. Куимӧт велӧтчан во" (1934), "Терехова Л. Г, Эрдели В. Г. География. Мӧдік тор. Нёльӧт класслӧ велӧтчан книга" (1934), "М. Потёмкин да П. Терехов. География. Учӧт грамотаа школаэз понда велӧтчан книга" (1934), "Д-р Ф. А. Копылов. Любознательнӧйезлӧн клуб" (1934), "А. А. Шибанов да мӧд. Природа тӧдмалан книга. Куимӧт во" (1932), "Н. А. Репина. Природа тӧдмалан книга. IV во велӧтчиссезлӧ" (1932).
  9. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Чужан муыд быдӧнлы колӧ (Э. Поляковалӧн 2024ʼ вося небӧг)", "Кӧдзыд пӧль (А. Сукгоевалӧн 2024ʼ вося небӧг)", "Ылӧ кольӧм вояс (Е. А. Игушевлӧн 2024ʼ вося небӧг)".
  10. Сканирование, создание pdf копий и размещение на сайте "Коми кывтӧдӧм" лингвистических изданий: "Г. В. Федюнева. Коми местоимение: к проблеме формального варьирования в языке" (2000), "Г. В. Федюнева. Местоимения 1-го и 2-го лица в пермских языках: исторические параллели" (2006), Г. В. Федюнева. Указательные местоимения и их производные в пермских языках" (2007).
  11. Внесение правок в текст "Коми-пермяцко-русского словаря" на сайте "Онлайн-словари FU-Lab".
  12. Вычитка варианта на современной орфографии и корректирование в программе LibreOffice Writer удмуртского текста учебника "Н. Н. Баранский. СССР географи. Шор ёзо школаын 6 но 7 араз дышетон книга. Нырысетӥ люкетэз" (1933).
  13. Исправление ошибки в поисковой системе корпуса, связанной с поиском по лемме слов с прописной буквы.
  14. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  15. Распространение комиязычного контента в соц. сетях.
  16. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2025.01.20.-2025.01.24

опубликовал Öньö Лав в 11:39 24.01.2025

​В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.01.20.-2025.01.24

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание фотокопий номеров газеты «Коми му» за второе полугодие 1991 года.
  3. Создание pdf файлов из фотокопий газеты «Коми му» (1991. № 9-11).
  4. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) текстов газеты «Коми му» (1991. № 9, 10, 16, 17).
  5. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №3); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Начало распознавания в программе ABBYY FineReader комиязычного издания "Е. А. Цыпанов. Перым коми гижӧд кыв" (1999).
  7. Сборка для корпуса текстов нового перевода Библии на коми язык (книги "Ӧксыяслӧн небӧгъяс", "Кад небӧгъяс").
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926 №№ 19), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  9. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "Н. А. Репина. Природа тӧдмалан книга. IV во велӧтчиссезлӧ" (1932).
  10. Сканирование, создание pdf копий и размещение на сайте "Коми кывтӧдӧм" лингвистических изданий: "Г. В. Федюнева. Коми местоимение: к проблеме формального варьирования в языке" (2000), "Г. В. Федюнева. Местоимения 1-го и 2-го лица в пермских языках: исторические параллели" (2006), Г. В. Федюнева. Указательные местоимения и их производные в пермских языках" (2007).
  11. Внесение правок в текст "Коми-пермяцко-русского словаря" на сайте "Онлайн-словари FU-Lab".
  12. Продолжение вычитки варианта на современной орфографии и корректирования в программе LibreOffice Writer удмуртского текста учебника "Н. Н. Баранский. СССР географи. Шор ёзо школаын 6 но 7 араз дышетон книга. Нырысетӥ люкетэз" (1933).
  13. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  14. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2025.01.13.-2025.01.17

опубликовал Öньö Лав в 21:11 19.01.2025

​В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.01.13.-2025.01.17

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer текстов газеты «Коми му» (1991. №№ 6, 7, 8, 14,15) (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  3. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2025. №№1, 2); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926 №№ 17, 18), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  5. Сборка для корпуса текстов нового перевода Библии на коми язык (книги "Олӧм", "Петӧм", "Левит", "Лыд", "Индӧд", Нав Исус", "Ёрдысьяс", "Руфа").
  6. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "Терехова Л. Г, Эрдели В. Г. География. Медодзза тор. Куимӧт велӧтчан во" (1934), "Терехова Л. Г, Эрдели В. Г. География. Мӧдік тор. Нёльӧт класслӧ велӧтчан книга" (1934), "М. Потёмкин да П. Терехов. География. Учӧт грамотаа школаэз понда велӧтчан книга" (1934), "Д-р Ф. А. Копылов. Любознательнӧйезлӧн клуб" (1934), "А. А. Шибанов да мӧд. Природа тӧдмалан книга. Куимӧт во" (1932).
  7. Внесение правок в текст "Коми-пермяцко-русского словаря" на сайте "Онлайн-словари FU-Lab".
  8. Продолжение вычитки варианта на современной орфографии и корректирования в программе LibreOffice Writer удмуртского текста учебника "Н. Н. Баранский. СССР географи. Шор ёзо школаын 6 но 7 араз дышетон книга. Нырысетӥ люкетэз" (1933).
  9. Исправление ошибки в поисковой системе корпуса, связанной с поиском по лемме слов с прописной буквы.
  10. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
     
FU-Lab. 2025.01.09.-2025.01.10

опубликовал Öньö Лав в 23:15 10.01.2025

​В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.01.09.-2025.01.10

  1. Создание фотокопий номеров газеты "Коми му" за первое полугодие 1991 года.
  2. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2024. №52); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  3. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) текстов газет «Коми му» (1991. № 5) и «Югыд туй» (1990. № 145).
  4. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "В. Н. Львов. Мый му пытшкын?" (1935), "В. Н. Львов. Музэгалӧммез" (1935), "В. Н. Львов. Вулканнэз" (1936), "В. А. Тетюрев. Природатӧдӧм. 1 тор. Куимӧт велӧтчан во" (1934), "В. А. Тетюрев. Природатӧдӧм. Мӧдік тор. Нёльӧт велӧтчан во" (1933), "И. Борисов, Е. Марова. Л. Павличева, В. Тетюрев. Природатӧдӧм. Етша велӧтчӧм йӧзлӧ" (1933), "П. Веприков, В. Ившин. Быдмас. Кыдз сія олӧ, кыдз керӧм да кытшӧм сетӧ польза" (1934), "В. Г. Фридман. Мый вылын видзсьӧ му" (1934).
  5. Внесение правок в текст "Коми-пермяцко-русского словаря" на сайте "Онлайн-словари FU-Lab".
  6. Вычитка варианта на современной орфографии и корректирование в программе LibreOffice Writer удмуртского текста учебника "Н. Н. Баранский. СССР географи. Шор ёзо школаын 6 но 7 араз дышетон книга. Нырысетӥ люкетэз" (1933).
  7. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  8. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2024.12.23.-2024.12.28

опубликовал Öньö Лав в 18:10 26.12.2024

​В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.12.23.-2024.12.28

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание фотокопий газет «Югыд туй» (1990. №№ 1-78) и «Коми му» (1991. №№1-9).
  3. Распознавание и вычитка в программе ABBYY FineReader и обработка распознанного текста газет «Югыд туй» (1990. №№ 1, 2, 153, 154, 155, 156) и «Коми му» (1990. № 1-4) в программе LibreOffice Writer.
  4. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Чужан муыд быдӧнлы колӧ (Э. Поляковалӧн 2024ʼ вося небӧг)", "Кӧдзыд пӧль (А. Сукгоевалӧн 2024ʼ вося небӧг)", "Ылӧ кольӧм вояс (Е. А. Игушевлӧн 2024ʼ вося небӧг)".
  5. Внесение правок в текст "Коми-пермяцко-русского словаря" на сайте "Онлайн-словари FU-Lab".
  6. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  7. Распространение комиязычного контента в соц. сетях.
  8. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2024ʼ вося отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 17:59 18.12.2024

2023-12-25–2004-12-20.

2. Работа в рамках создания параллельного корпуса (kv-ru) и машинного переводчика:

2.1. Приобретение, сканирование и обработка в программе ABBYY FineReader, создание pdf копий 44 русскоязычных издания, с которых были сделаны коми переводы: "Б. В. Всесвятский. Ботаника" (1957), "В. Ф. Шалаев и Н. А. Рыков. Зоология" (1952), "Р. Джованьоли. Спартак" (1936), "А. Додэ. Тартарен из Тараскона" (1938), "М. Водопьянов. Гордое слово" (1955), "Болгарские сказки" (1957), "М. Ильин, Е. Сегал. В нашем городе" (1955), "В. Каверин. Мужество" (1954), "Ованес Гукасян. Маленькие мстители" (1952), "Венгерские народные сказки" (1958), "Жан Грива. Рассказы об Испании" (1953), "Глеб Комаровский, Николай Комаровский. Повесть о корейском мальчике" (1950), "Китайские народные сказки" (1953), "Чу Чэн. Тайна разрушенного храма" (1958), "Е. Д. Стасова. Таким был В. И. Ленин" (1965), "Ю. Сотник. Как я был самостоятельным" (1959), "Макс Зингер. Рассказы старого полярника" (1959), "История средних веков. 6-7 класс" (1940), "О. Иваненко. Тарасова доля" (1940), "Наша дорога" (1953), "И. Н. Шевченко. Арифметика" (1959), "В. К. Арсеньев. Дерсу Узала" (1955), "И. Арамилев. На лесной тропе" (1952), "Ю. Сотник. Один страшный день" (1962), "А. Авдеенко. У карпатского костра" (1957), "М. Марьенков. Знак дружбы" (1950), "Б. Емельянов. Мечта" (1955), "Анри Барбюс. Огонь" (1935), "О. Б. Лепешинская. Клетка и ее происхождение" (1951), "Го Мо-жо. Избранное" (1953), "Мао Дунь. Сочинения. Том третий" (1956), "Иван Франко. Рассказы" (1953), "Забавные сказки" (1951), "А. Новиков-Прибой. Цусима. Книга вторая" (1935), "Золотые руки" (1950), "П. Журба. Александр Матросов" (1951), "Русские богатыри" (1951), "Г. Кржижановский. Великий Ленин" (1956), "Л. Жариков. Повесть о суровом друге" (1952), "Ю. Герман. Рассказы о Дзержинском" (1952),   "В. Гюго. Девяносто третий" (1937), "Б. В. Всесвятский. Ботаника" (1934), "Б. В. Всесвятский. Ботаника" (1936), "М. Я. Цузмер. Зоология" (1936), "А. Н. Кабанов. Анатомия" (1937).

2.2. Поиск в сети Интернет и сбор текстов русскоязычных оригиналов 42 комиязычных изданий: "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс" (1948), "Валентин Катаев. Полклӧн пи" (1947), "А. И. Герцен. Повестьяс" (1956), "Г. Х. Андерсен. Дюймовочка" (1952), "Н. В. Гоголь. Вий" (1939), "Н. В. Гоголь. Тарас Бульба" (1939), "И. С. Тургенев. Муму" (1957), "И. С. Тургенев. Батьяс да пиян" (1940), "Арк. Гайдар. Тимур да сылӧн команда" (1941), "Н. А. Островскӧй. Гроза" (1941), "В. Г. Короленко. Му пытшкын олысь челядь" (1952), "Сталин йылысь висьтъяс" (1941), "В. Овечкин. Передньӧй крайын" (1954), "Ж. Рони-Старший. Би вӧсна тыш" (1940), "В. Панова. Серёжа" (1960), "Н. Островский. Бушковын чужысьяс" (1957), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "А. Гончар. Знаменосецъяс" (1955), "П. Павленко. Степнӧй шонді" (1951), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), Д. Медведев. Ыджыд сьӧлӧма йӧз" (1954), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), а также 12 pdf-копий русскоязычных оригиналов коми изданий:  "Н. М. Коробков. Кутузов" (1945),  "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), Г. Скребицкий "Бӧбъяс да мудеръяс" (1951), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "С. А. Пономарёв, Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "С. П. Алексеев, В. Г. Карцов. СССР-лӧн история" (1963), "А. В. Мишулин. Древньӧй мирлӧн история" (1941), "Е. А. Косминский. Шӧр нэмъяслӧн история" (1955), "Джонатан Свифт. Гулливер великанъяс ордын" (1939), "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), "Ф. Гладков. Клятва" (1947).

2.3. Распознавание и вычитка в программе ABBYY Fine Reader текстов 55 русскоязычных изданий, имеющих коми эквиваленты: "Ф. П. Коровкин. История Древнего мира" (1962), "Б. В. Всесвятский. Ботаника" (1957), "В. А. Тетюрёв. Ботаника" (1949), "Г. И. Иванов и А. С. Добров. География частей света и важнейших зарубежных стран" (1954), "А. В. Мишулин. История Древнего мира" (1947), "В. Ф. Шалаев, Н. А. Рыков. "Зоология" (1952), "Ли Цзе. Котенок, который вздумал летать" (1958), "Проф. Н. М. Коробков. Кутузов" (1945), "Е. А. Косминский. История средних веков" (1960), "Р. Джованьоли. Спартак" (1936), "А. Додэ. Тартарен из Тараскона" (1938), "Чу Чэн. Тайна разрушенного храма" (1958), "М. Водопьянов. Гордое слово" (1955), "Болгарские сказки" (1957), "М. Ильин, Е. Сегал. В нашем городе" (1955), "В. Каверин. Мужество" (1954), "Ованес Гукасян. Маленькие мстители" (1952), "Венгерские народные сказки" (1958), "Жан Грива. Рассказы об Испании" (1953), "Глеб Комаровский, Николай Комаровский. Повесть о корейском мальчике" (1950), "Китайские народные сказки" (1953), "С. П. Алексеев, В. Г. Карцов. История СССР" (1961), "Е. Д. Стасова. Таким был В. И. Ленин" (1965), "Ю. Сотник. Как я был самостоятельным" (1959), "Макс Зингер. Рассказы старого полярника" (1959), "О. Иваненко. Тарасова доля" (1940), "История средних веков" (1940), "А. Барбюс. Огонь" (1936), "В. К. Арсеньев. Дерсу Узала" (1955), "М. Марьенков. Знак дружбы" (1950), "И. Арамилев. На охотничьей тропе" (1952), "А. Авдеенко. У Карпатского костра" (1957), "Ю. Сотник. Один страшный день" (1962), "О. Б. Лепешинская. Клетка и ее происхождение" (1951), "И. Н. Шевченко. Арифметика" (1959), "Наша дорога" (1953), "Б. Емельянов. Мечта" (1955), "Золотые руки" (1950), "П. Журба. Александр Матросов" (1951), "Г. Скребицкий. Простофили и хитрецы" (1944), "И. Н. Шевченко. Арифметика для 5 и 6 классов" (1959), "Забавные сказки" (1951), "С. Ковпак. От Путивля до Карпат" (1970), "Л. Жариков. Повесть о суровом друге" (1952), "В. Гюго. Девяносто третий" (1937), "Ю. Герман. Рассказы о Дзержинском" (1952), "Краткий курс истории СССР" (1937), "Русские богатыри" (1951), "А. Новиков-Прибой. Цусима. Книга вторая" (1935), "Гладков. Клятва" (1945), "Г. Кржижановский. Великий Ленин" (1956), "М. Я. Цузмер. Зоология" (1933), а также рассказов из русскоязычных изданий: "Го Мо-жо. Избранное" (1953), "Мао Дунь. Сочинения. Том третий" (1956), "Б. В. Всесвятский. Ботаника" (1934), "Б. В. Всесвятский. Ботаника" (1936), "М. Я. Цузмер. Зоология" (1936);  обработка данных текстов в программе LibreOffice Writer.

2.4. Выравнивание по предложениям в программе WinMerge с русскоязычным оригиналом текстов 106 переводного издания: "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957),  "Г. М. Кржижановский. Шу-шу" (1969), "Б. В. Всесвятский. Ботаника" (1957), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), "С. А. Пономарёв, Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "В. Ф. Шалаев, Н. А. Рыков. Зоология" (1952), "А. В. Мишулин. Древньӧй мирлӧн история" (1941), "В. Бианки. Висьтъяс да мойдъяс" (1952), "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Проф. Н. М. Коробков. Кутузов" (1945), "Е. А. Косминский. Шӧр нэмъяслӧн история" (1955), "Р. Джованьоли. Спартак" (1939), "А. Гончар. Знаменосецъяс" (1955), "П. Павленко. Степнӧй шонді" (1951), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), Д. Медведев. Ыджыд сьӧлӧма йӧз" (1954), "А. Додэ. Тарасконса Тартарен" (1940), "Чу Чэн. Киссьӧм храмлӧн гусятор" (1959), "Болгарсӧй мойдъяс" (1958), "Венгерскӧй народнӧй мойдъяс" (1958), "Жан Грива. Испания йылысь рассказъяс" (1955), "Ованес Гукасян. Ичӧтик мстительяс" (1955), "М. Ильин, Е. Сегал. Миян карын" (1957), "В. Каверин. Мужестволӧн школа" (1957), "Китайскӧй народнӧй мойдъяс" (1953), "Глеб Комаровский, Николай Комаровский. Корейскӧй детинка йылысь повесть" (1953), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Ю. Сотник. Кыдзи ме олі ас кежын" (1961), "М. Зингер. Пӧрысь полярниклӧн висьтъяс" (1962), "О. Иваненко. Тараслӧн доля" (1940), "В. Панова. Серёжа" (1960), "Н. Островский. Бушковын чужысьяс" (1957), "С. П. Алексеев, В. Г. Карцов. СССР-лӧн история" (1963), "В. К. Арсеньев. Дерсу Узала" (1957), "М. Марьенков. Дружба" (1958), "И. Арамилев. Вӧралан трӧпа вылын" (1956), А. Авдеенко "Карпатскӧй бипур дорын" (1962), "Ю. Сотник. Ӧти страшнӧй лун" (1964), "О. Б. Лепешинская. Клетка да сылӧн происхождение" (1954), "Шӧр нэмъяслӧн история" (1941), "В. Овечкин. Передньӧй крайын" (1954), "Ж. Рони-Старший. Би вӧсна тыш" (1940), "Го Мо-жо. Рассказъяс" (1954), "Мао Дунь. Рассказъяс" (1957), "Сталин йылысь висьтъяс" (1941), "Анри Барбюс. Би" (1941), "Н. В. Гоголь. Вий" (1939), "Н. В. Гоголь. Тарас Бульба" (1939), "И. С. Тургенев. Муму" (1957), "И. С. Тургенев. Батьяс да пиян" (1940), "Арк. Гайдар. Тимур да сылӧн команда" (1941), "Н. А. Островскӧй. Гроза" (1941), "В. Г. Короленко. Му пытшкын олысь челядь" (1952), "Миян туй" (1957), "А. И. Герцен. Повестьяс" (1956), "Г. Х. Андерсен. Дюймовочка" (1952), "Джонатан Свифт. Гулливер великанъяс ордын" (1939), "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), Г. Скребицкий "Бӧбъяс да мудеръяс" (1951), "Валентин Катаев. Полклӧн пи" (1947), "П. Журба. Александр Матросов" (1951), "Б. Емельянов. Мечта" (1955), "И. Н. Шевченко. Арифметика" (1957), "Игнатов. Вокъяс-геройяс" (1947), "Гажа мойдъяс" (1948), "Роч богатыръяс" (1951), "СССР-лӧн история. Дженьдӧдӧм курс" (1939),  "А. Новиков-Прибой. Цусима. Мӧд книга" (1948), "Л. Пантелеев. Честнӧй кыв" (1947), "С. Ковпак. Путивльсянь Карпатыӧдз"  (1953), "Л. Жариков. Суровӧй друг йылысь повесть" (1953), "Ф. Гладков. Клятва" (1947), "В. Гјуго. Ӧкмысԁас којмӧԁ" (1937), "Иосиф Виссарионович Сталин: краткӧй биография" (1947), M. J. Cuzmer. Zoologija" (1933), "М. Ј. Цузмер. Зоологіја" (1936), B. V. Vşeşvjatskij. Вotaꞑika (1934), "Б. В. Вԍеԍвјатскіј. Ботаԋіка" (1936).

2.5. Создание фотокопий отсутствовавших страниц изданий: "Г. И. Иванов, А. С. Добров. География частей света и важнейших зарубежных стран. Учебник для 6 класса. Издание шестнадцатое" (1954. С. 179, 180); "С. П. Алексеев и В. Г. Карцов. История СССР. Учебная книга для 4-го класса. Шестое издание" (1961. С. 137, 138, 131, 132); "О. Иваненко. Тарасова доля" (1940. С. 59, 60, 61, 62); "Анри Барбюс. Огонь" (1935. С. 183, 184, 193, 194); "М. Белахова. Драгоценный груз" (1950, рассказы: "В Калькутту", "Случай в самолёте"); "Г. И. Иванов, А. С. Добров. География частей света и важнейших зарубежных стран. Учебник для 6-го класса. 12-е изд." (1950, разделы: "Югославия", "Турция"), "Б. Емельянов. Мечта" (1955). Обработка и распознавание фотоснимков в программе ABBYY Fine Reader и добавление недостающих частей текста в параллельный корпус.

2.6. Создание фотокопий страниц издания "П. В. Козлов, В. А. Мезенцев. Чудесная быль" (1958), распознавание и вычитка в программе ABBYY Fine Reader, обработка в программе LibreOffice Writer и первичное выравнивание в программе WinMerge с ранее распознанным коми переводом 1960 года.

2.7. Распознавание и вычитка в программе ABBYY FineReader текста книги О. Уляшева "Излань зыран, коми зыран" на коми и русском языках, проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer; разделение коми и русских текстов по разным файлам, разбивка на строки по предложениям и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.
Первичное выравнивание в программе WinMerg комиязычных и русскоязычных текстов книги Е. Козловой «Туй дор бадь» («Придорожная ива») и перевод с помощью телеграм-бота не имеющих иноязычных соотвествий частей текстов произведений Е. Козловой «Шундыр», «Кыр йылын бӧрдіс гудӧк» («На пригорке играла гармонь»), «Туй дор бадь» («Придорожная ива») на русский язык для параллельного корпуса и для включения в базу переводчика.

2.8. Сборка текстов новостной ленты официального портала РК на коми и русском языках за январь-декабрь 2023 г. и январь-июль 2024 г., их выравнивание по предложениям в программе WinMerge и включение в параллельный корпус.

2.9. Редактирование русскоязычных новостных текстов радио "Коми гор" за 2018 г. для параллельного корпуса. Разделение новостных текстов радио "Коми гор" за 2015 год на русском и коми языках на новостные тексты и репортажи.

2.10. Перевод на коми язык с помощью телеграм-бота текстов для чек-контроля переводчика на коми язык с последующим редактированием.

2.11. Перевод на коми язык с помощью телеграм-бота новостных текстов за 23-25.01 и 2-3.07.2024 c сайта bnkomi.ru,  за 11-15.01 и 2-3.07.2024 c сайта komiinform.ru; редактирование коми текстов и выравнивание коми и русских текстов в программе WinMerge для включения в  базу переводчика.

2.12. Перевод с помощью онлайн-ресурса "Майбыр" текстов газеты "Коми му" (2024. №1-5) и текста издания: "А. Шебырев. Фараон" (2019) на русский язык и редактирование перевода для пополнения текстовой базы русско-коми переводчика.

2.13. Подбор и распределение материала для перевода на коми язык из массива корпуса текстов, предоставленных МКАO «Яндекс»; восстановление нарушенной структуры текста в файле с переводом одного из сегментов корпуса предложений МКАО "Яндекс"; сборка текстов переводов, сделанных для МКАО "Яндекс".

2.14. Пополнение параллельного корпуса и текстовой базы переводчика первой группой текстов учебного пособия "Планиметрия курс" на коми и русском языках; терминологическая модернизация текста учебника "И. Н. Шевченко. Арифметика" (1957) для датасета переводчика.

2.15. Первичное развертывание и настройка нейронной библиотеки  глубокого машинного обучения openNMT.

2.16. Проведение работ по обучению модели русско-коми переводчика на  основе нейронных сетей (библиотека Sockeye), обучено 15  экспериментальных моделей.

2.17. Создание бота для автоматизации запросов к переводчику.

2.18. Добавление в параллельный русско-коми корпус выравненных текстов, обработанных за отчетный период.

2.19. Исправление метаразметки в параллельном корпусе.

2.20. Продолжение унификации орфографии и модернизации терминологиии в датасете для нейросети.

2.21. Сбор оригинальных и переводных текстов нормативно-правовых актов Республики Коми на русском языке за 2023 год, создание метаразметок для корпуса коми языка. Выравнивание нормативно-правовых актов Республики Коми на коми и русском языках за 2023 год для параллельного корпуса.

Объём русско-коми параллельного корпуса за отчетный период возрос на 329 177 единиц и к 2024-12-20 составляет 1 742 005 выравненных предложений (с повторами).

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий 94 комиязычный изданий: "О. Шлопова. Туръяса мойдъяс да висьтъяс", "Агіт-пјесајас"  (1924), "Щыкӧԁӧм морт" (1924), "Жԁанов Б. А. Кӧԇан машіна" (1930), "Іванов Н. І., Ԁубровін Н. В. Вӧр кылӧԁӧм" (1931), "І. Рејн. Кыԇі вӧчӧма трактор" (1931), "Бојко П. А. Вӧрлеԇӧмын ԁа кылӧԁчӧмын брігаԁајас" (1933), "Б. В. Вԍеԍвјатскіј. Ботаԋіка" (1936), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Шалаев В. Ф., Рыков Н. А. Зоология" (1952), "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "М. Н. Скаткин. Природоведение" (1968),  Б. В. Всесвятский. Ботаника" (1940), И. Н. Шевченко. Арифметика" (1957), "С. А. Пономарёв да Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "И. И. Заславский да Т. П. Герасимова. Физическӧй география. Начальнӧй курс" (1957), "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), "Р. Джованьоли. Спартак" (1939), "В. Бианки. Висьтъяс да мойдъяс" (1952), "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Анри Барбюс. Би" (1940), "Гажа мойдъяс" (1948), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), П. Павленко. Степнöй шонді" (1951), С. П. Алексеев, В. Г. Карцов. СССР-лӧн история : 4-ӧд кл. велӧдчан книга" (1963), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "К. С. Косяков. Алкоголизмкöд тышкасьöм" (1958), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Руч да кöч" (1959), "Дм. Медведев. Ыджыд сьӧлӧма йӧз" (1954), "Шӧр нэмъяслӧн история" (1941), "Е. А. Косминский. Средньӧй векъяслӧн история" (1951), "Чоя-вока" (1950), "М. Горький. Иванушка-дурачок" (1947), "М. Горький. Висьтъяс" (1947), "Н. А. Некрасов. Генерал Топтыгин" (1947), "Е. Смирнов. Павлик Морозов" (1940), "Ԋ. Островскіј. Бушковын чужыԍјас" (1937), "Ж. Рони-старший. Би вöсна тыш" (1940), "А. Новиков-Прибой. Забавнöй вöскресенья" (1940), "М. Горький. Ильялöн ичöтдырся олöм" (1940), "Куим пи" (1940), "В. Г. Короленко. Синтöм музыкант" (1940), "Сталин йылысь висьтъяс" (1941), "Александр Серафимович. Воробьинöй вой" (1941), "Ленин йылысь висьтъяс" (1941), "Хечо-лентяй" (1941), "Миян туй" (1957), "Валентин Катаев. Полклӧн пи" (1947), "Г. Скребицкий. Бӧбъяс да мудеръяс" (1951), "П. Игнатов. Вокъяс-геройяс" (1947), "Федор Гладков. Клятва" (1947), "СССР-лӧн история. Дженьдӧдӧм курс" (1939), "Пантелеев Л. Честнӧй кыв" (1947), "Ковпак. Путивльсянь Карпатыӧдз" (1953), "Игорь Всеволожский. Кӧкъямыс смел будёновец" (1963),  "Ю. Ермолаев. Гажа висьтъяс" (1963), "Г. Кржижановский. Великӧй Ленин" (1958), "Ю. Герман. Дзержинскӧй йылысь рассказъяс" (1953), "Оласӧ да вӧласӧ" (1991), "В. Юхнин. Тундраса бияс. Первой часть" (1949), "В. Юхнин. Тундраса бияс. Мӧд часть" (1951), "Г. Ивкучева. Борд пӧла каля" (2022),  "В. Лодыгин. Габовсаяс" (2015).

3.2. Распознавание и вычитка в программе ABBYY Fine Reader коми текстов 124 изданий: "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957),  "Г. М. Кржижановский. Шу-шу" (1969), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "С. А. Пономарёв да Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "Б. В. Всесвятский. Ботаника" (1940),  "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Шалаев В. Ф., Рыков Н. А. Зоология" (1952), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963),  "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс : рисунокъяс авторлöн" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), "В. Бианки. Висьтъяс да мойдъяс" (1952), "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Р. Джованьоли. Спартак" (1939), "Л. Жариков. Суровӧй друг йылысь повесть" (1953), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), "А. Гончар. Знаменосецъяс" (1955), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "К. С. Косяков. Алкоголизмкöд тышкасьöм" (1958), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Руч да кöч" (1959), "А. Барбюс. Би" (1941), "Дм. Медведев. Ыджыд сьӧлӧма йӧз (1954), "С. П. Алексеев, В. Г. Карцов. СССР-лӧн история" (1963), "Шӧр нэмъяслӧн история" (1941), "П. Павленко. Степнӧй шонді" (1951), "Е. Юнга. Бессмертнӧй корабль" (1953), "А. Матвеев. Александр Матросов" (1953), "М. Марьенков. Дружба" (1958), "В. Панова. Серёжа" (1960), "Н. Островский. Бушковын чужысьяс" (1957), "А. Новиков-Прибой. Цусима. Мӧд книга" (1948), "Ж. Рони-старший. Би вöсна тыш" (1940), "А. Новиков-Прибой. Забавнöй вöскресенья" (1940), "М. Горький. Ильялöн ичöтдырся олöм" (1940), "Куим пи" (1940), "В. Г. Короленко. Синтöм музыкант" (1940), "Сталин йылысь висьтъяс" (1941), "Александр Серафимович. Воробьинöй вой" (1941), "Ленин йылысь висьтъяс" (1941), "Хечо-лентяй" (1941), "И. Н. Шевченко. Арифметика" (1957), "В. Овечкин. Передньӧй крайын" (1954), "Б. Емельянов. Мечта" (1957), "Н. В. Гоголь. Вий" (1939), "Н. В. Гоголь. Тарас Бульба" (1939), "Джонатан Свифт. Гулливер великанъяс ордын" (1939), "И. С. Тургенев. Муму" (1957), "И. С. Тургенев. Батьяс да пиян" (1940), "Г.-Х. Андерсен. Мисьтӧм уткапи" (1939), "Г.-Х. Андерсен. Стойкӧй озысь салдат" (1947), "В. Маяковский. Челядьлы" (1948), "Али-Баба да нелямын разбойник" (1950), "А. Афанасьев. Царевна-лягушка" (1951), "А. И. Герцен. Повестьяс" (1956), "Арк. Гайдар. Тимур да сылӧн команда" (1941), "А. С. Пушкин. Поп да сылӧн казак балда йылысь мойд" (1954), "А. Тостой. Зарни Ключ, либӧ Буратинолӧн приключениеяс" (1950), "А. Чехов. Бӧрйӧм гижӧдъяс" (1939), "В. Г. Короленко. Му пытшкын олысь челядь" (1952), "В. Катаев. Полклӧн пи" (1947), "Г. Скребицкий. Бӧбъяс да мудеръяс" (1947), "Г. Х. Андерсен. Дюймовочка" (1952), "Д. Григорович. Гуттаперчевӧй детинка" (1951), "Д. Мамин-Сибиряк. Руд Сьылі" (1950), "Д. Н. Мамин-Сибиряк. Медведко" (1953), "Е. Смирнов. Павлик Морозов" (1940), "К. Ушинскӧй. Бишка"(1950), "К. Ушинскӧй. Кыдзи дӧрӧм му вылын быдмис" (1950), "К. Ушинскӧй. Рассказъяс" (1950), "Л. Н. Толстой. Кык ёрт" (1952), "Л. Толстой. Рассказъяс" (1950), "М. Горький. Висьтъяс" (1947), "М. Горький. Иванушка-дурачок йылысь" (1947), "Миян туй" (1957), "М. Лермонтов. Миян кадся герой" (1939), "Н. А. Некрасов. Генерал Топтыгин" (1947), "Н. А. Некрасов. Мазай дед да кӧчьяс" (1956), "Н. А. Островскӧй. Гроза" (1941), "Русскӧй богатырьяс" (1951), "С. Т. Аксаков. Алӧй дзоридз" (1951), "Чоя-вока" (1950), "П. Игнатов. Вокъяс-геройяс" (1947), "Федор Гладков. Клятва" (1947), "СССР-лӧн история. Дженьдӧдӧм курс" (1939), "А.С.Новиков-Прибой. Цусима. Книга 2" (1935), "Пантелеев Л. Честнӧй кыв" (1947), "Игорь Всеволожский. Кӧкъямыс смел будёновец" (1963), "Ю. Ермолаев. Гажа висьтъяс" (1963),  "Ю. Герман. Дзержинскӧй йылысь рассказъяс" (1953), "Г. Кржижановский. Великӧй Ленин" (1958); "Г. Ивкучева. Борд пӧла каля" (2022), "В. Лодыгин. Габовсаяс" (2015), "В. Юхнин. Тундраса бияс. Первой часть" (1949), "В. Юхнин. Тундраса бияс. Мӧд часть" (1951), "А. Мишарин. Кор лэбзьӧ коляоз" (2016) ; обработка распознанных текстов в программе LibreOffice Writer.

3.3. Создание фотокопий статей номеров газеты "Югыд туй" за июль-декабрь 1990 года. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990 №№79-152 и их обработка в программе LibreOffice Writer.

3.4. Электронная подписка на газету "Выль туйӧд" на 2024-2025 гг. с сбор pdf файлов с номерами газеты "Выль туйӧд" за 2022-2023 гг. в закрытой группе редакции газеты.

3.5. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №52; 2024. №№1-51), журналов "Йӧлӧга" (2023. №№11, 12; 2024. №№1-11), "Войвыв кодзув" (2023 №№11-12; 2024 №1-11), "Чушканзі" (2021. №1; 2022. №№1-12; 2023 №№ 1-12, 2024. №№ 1-11) и "Би кинь" (2020. №№11, 12; 2024. №№1-11), а также  номеров газеты "Выль туйӧд" (2021. №№ 31, 32, 33, 35, 36, 37, 38, 39, 41, 42, 43, 44, 45,46 47, 49, 50 51, 52, 53; 2022 №№ 1-10, 12-16, 18, 20-27, 28, 31, 33, 34, 42-49, 50-52, 2023. №№1-2); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).

3.6. Продолжение технической работы над историческим разделом корпуса коми языка.

3.7. Добавление в корпус коми языка текстов, обработанных за отчетный период.

Объём корпуса коми языка за отчетный период возрос на 5 369 844 единицы и к 2024-12-20 составляет 87 114 057 словоупотреблений.

4. Текстовое пополнение молодцовского и латинского корпуса:

4.1. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов 9 комиязычных изданий: "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), "А. П. Чехов. Ваԋка" (1937), "Віктор Гјуго. Ӧкмысԁас којмӧԁ" (1937), "О. Перовскаја. Чеԉаԃјас ԁа ԅверјас" (1937), "С. М. Горскіј. Пу уҗјас строіԏеԉствоын" (1935), "І. Г. Попов,  Т. Н. Крупеԋенкін, Р. Н. Каԉіԋін. Маԏемаԏіка. ШКМ-ын 1-ја во вылын велӧԁчыԍјаслы уҗалан ԋіга" (1931), "М. Ј. Цузмер. Зоологіја" (1936); проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer.

4.2. Конвертация на современную графику молодцовских текстов и обработка в программе LibreOffice Writer модернизированных текстов изданий: "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), "А. П. Чехов. Ваԋка" (1937), "Віктор Гјуго. Ӧкмысԁас којмӧԁ" (1937), "Б. В. Вԍеԍвјатскіј. Ботаԋіка" (1936), "М. Ј. Цузмер. Зоологіја" (1936)

4.3. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1925. №№ 25-37; 1926 №№ 1-16), газеты "Југыԁ туј" (1925. №№ 210, 213, 215, 219, 226, 228, 232, 237, 241, 246, 251; 1926. №№ 19, 20) и журнала "Комі му" (1924. №№ 3, 4-6, 7-10; 1925 №№ 3-4, 5, 6-7, 8, 9, 10-11, 12), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".

4.4. Конвертация на современную графику молодцовских текстов и обработка в программе LibreOffice Writer модернизированных текстов изданий:  "M. J. Cuzmer. Zoologija" (1933), "B. V. Vşeşvjatskij. Вotaꞑika" (1934).

4.5. Разработка плана реализации функции альтернативного поиска в корпусе коми языка на современной и прежних системах письма в текстах донациональной, молодцовской и латинской эпох коми письменности.

Объём молодцовского корпуса за отчетный период возрос на 351 495 единиц и к 2024-12-20 составляет 2 985 629 словоупотреблений.

Объём латинского корпуса за отчетный период возрос на 57 795 единиц и к 2024-12-20 составляет 420 148 словоупотреблений.

5. Пополнение онлайн библиотеки "Коми гижӧд":

5.1. Размещение в онлайн библиотеке "Коми гижӧд" коми текстов 25 номеров газеты "Комі ԍікт" и 15 номеров газеты "Југыԁ туј" за 1925-1926 гг., а также коми текстов 10 выпусков журнала "Комі му" за 1924-25 гг. в переводе на современную графику.

5.2. Размещение в онлайн библиотке "Коми гижӧд" 71 произведения из сборника "В. Г. Лодыгин. Габовсаяс" (2015).

5.3. Размещение в онлайн библиотеке "Коми гижӧд" 51 произведения из журналов:  Алёна Ельцова: стихотворения "Каня-понъя", "Пӧжасьысьяс", "Кӧза", "Пон да кань"; "Поэзия", "Кымӧр-кунӧр", "Китыр лым чирйӧн али кодзулӧн...", "Вой кежлас ывлаын ёна на кынтавлӧ...", "Рӧмдас да, керкаысь ывлаӧ пета...", "Югыдлӧз", "Турунъяс вӧрзьӧны пемыд му пыдӧсын...", "Йӧлӧга шыӧн таланьӧ коркӧ волы...", "Эз жарӧн, Эз косӧн...", "Вылісянь сьылӧмӧн му вылӧ...", "Сьыв мен асъядорыс, шоныд тӧвру...", "Усь, лымйӧй, усь, — мед менам сьӧлӧм югзяс...", "Саридз";  Алёна Старцева: "Ӧтик-мӧтик", "Аддзӧмтор"; Алёна Шомысова: "Каньлы ним",  "Льӧм дзоридзалігӧн", "Мӧвп", "Жытник", "Волсяса вичко", "Пес чипас", переводные сказки "Миша ошпи да Би кинь", "Дивӧ-дзоридз"; Баженова Ольга: стихотворение "Чушканзі";  Василий Лодыгин: стихотворения "Медсяяс", "Муса чужанін";  Евгений Игушев: рассказ "Сюрук Ӧксялӧн ыжпи"; Елена Афанасьева: "Вӧрса гусяторъяс"; Зарни Люся: стихотворения "Аканьяс", "Батьӧ ньӧбис телевизор"; "Сашук", "Ва пельса", "Гӧстя", "Менам ёрт", "Мичаа шырӧм", "Нӧдкывъяс", "Пудъясянкывъяс", "Кывбертласъяс"; рассказ "Тыдавтӧм кымӧр";  Иван Ногиев: рассказы "Гӧрд пӧк", "Крукасин"; "Мык",  "Транспортир",  "Патер", "Сконйыштчис"; Нина Обрезкова: "Пӧчлы отсӧг"; Прокопий Габов: статья "Андаман саридзса Пхукетын дас лун";  Серафим Попов: стихотворения "Еджыд ывла", "Ичӧт лыддьысьысь".

Количество текстов в библиотеке за отчетный период возрасло на 1645 единиц и к 2024-12-20 составляет 18429 текстов.

6. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

6.1. Создание общего указателя публикаций журнала «Войвыв кодзув» за 2014-2024 год.

6.2. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по 126 книжным изданиям на коми языке: "Миян Тима Вень (2020ʼ вося альбом)", "Турьяса мойдъяс да висьталӧмъяс (О. Шлопова, 2004ʼ вося небӧг)", "Коми йӧзкостса нӧдкывъяс (2008ʼ вося небӧг)", "Ворсыштам, дзолюк (Остапова З. В., 2005ʼ вося небӧг)", "Коми йӧз кывйӧн нэм кежлӧ пасйыны (2005ʼ вося небӧг)", "Ботаника (5-ӧд да 6-ӧд классъяслы, 1940ʼ вося небӧг)", "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс : рисунокъяс авторлöн" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940),  "В. Бианки. Висьтъяс да мойдъяс" (1952), "Р. Джованьоли. Спартак" (1939), "Би (А. Барбюс, 1941ʼ вося небӧг)", "Ыджыд сьӧлӧма йӧз (Д. Медведев, 1954ʼ вося небӧг)", "Коми ошканкывъяс (Е. Цыпановлӧн 2024ʼ вося небӧг)", "Степнӧй шонді (П. А. Павленко, 1951ʼ вося небӧг)", "Зарни кияс (1953ʼ вося небӧг)"‎, "Метелица (А. А. Фадеев, 1954ʼ вося небӧг)", "Средньӧй векъяслӧн история (1951 вося небӧг)"‎, "Шӧр нэмъяслӧн история (1941ʼ вося небӧг)", "Алкоголизмкӧд тышкасьӧм (К. С. Косяков, 1958ʼ вося небӧг)", "Ботаника (1952ʼ вося небӧг)", "Гажа мойдъяс (1948ʼ вося небӧг)", "География (4-ӧд класслы 1956ʼ вося небӧг)"‎‎, "География кузя лыддьысян книга (1957ʼ вося небӧг)", "Древньӧй мирлӧн история (5-ӧд класс, 1963' вося небӧг)", "Зоология (1952ʼ вося небӧг)"‎‎, "Кӧзяин да работник (О. Туманян, 1952ʼ вося небӧг)", "Мойдъяс (М. Горькӧй, 1952ʼ вося небӧг)", "Руч да кӧч (1959ʼ вося небӧг)", "Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география (1951ʼ вося небӧг)", "СССР-лӧн география (1957ʼ вося небӧг)", "СССР-лӧн история (1963ʼ вося небӧг)"‎‎, "Татшӧм вӧлі Владимир Ильич Ленин (Е. Д. Стасова, 1966ʼ вося небӧг)", "Тема да Жучка (1954ʼ вося небӧг)", "Чери кыйысь да чери йылысь мойд (А. С. Пушкин, 1956ʼ вося небӧг)", "Январь 9-ӧд лун (М. Горький, 1958ʼ вося небӧг)", "Би вöсна тыш (1940ʼ вося небӧг)", "Забавнöй вöскресенья (1940ʼ вося небӧг)", "Ильялöн ичöтдырся олöм (1940ʼ вося небӧг)", "Куим пи (1940ʼ вося небӧг)", "Синтöм музыкант (1940ʼ вося небӧг)", "Сталин йылысь висьтъяс (1941ʼ вося небӧг)", "Воробьинöй вой (А. Серафимович, 1941ʼ вося небӧг)", "Ленин йылысь висьтъяс (1941ʼ вося небӧг)", "Хечо-лентяй (1941ʼ вося небӧг)", "Стойкӧй озысь салдат (Г. Х. Андерсен, 1947ʼ вося небӧг)", "Челядьлы (В. Маяковскӧй, 1948ʼ вося небӧг)", "Али-Баба да нелямын разбойник (1950ʼ вося небӧг)", "Руд Сьылі (Д. Н. Мамин-Сибиряк, 1950ʼ вося небӧг)", "Рассказъяс (Л. Н. Толстой, 1950ʼ вося небӧг)", "Бишка (К. Ушинскӧй, 1950ʼ вося небӧг)", "Кыдзи дӧрӧм му вылын быдмис (К. Ушинскӧй, 1950ʼ вося небӧг)", Царевна-лягушка (1951ʼ вося небӧг), "Алӧй дзоридз (1951ʼ вося небӧг)", "Дюймовочка (1952ʼ вося небӧг)", "Кык ёрт (Л. Н. Толстой, 1952ʼ вося небӧг)", "Медведко (1953ʼ вося небӧг)", "Поп да сылӧн казак Балда йылысь мойд (А. С. Пушкин, 1954ʼ вося небӧг)", "Мазай дед да кӧчьяс (Н. А. Некрасов, 1956ʼ вося небӧг)", "Повестьяс (А. И. Герцен, 1956ʼ вося небӧг)", "Му пытшкын олысь челядь (В. Г. Короленко, 1952ʼ вося небӧг)", "Русскӧй богатыръяс (1951ʼ вося небӧг)", "Зарни ключ, либӧ Буратинолӧн приключениеяс (А. Н. Толстой, 1950ʼ вося небӧг)", "Гроза (А. Н. Островскӧй, 1941ʼ вося небӧг)", "Тимур да сылӧн команда (А. Гайдар, 1941ʼ вося небӧг)", "Миян кадся герой (М. Ю. Лермонтов, 1939ʼ вося небӧг)", "Бӧрйӧм гижӧдъяс (А. П. Чехов, 1939ʼ вося небӧг)", "Полклӧн пи (В. Катаев, 1947ʼ вося небӧг)", "Бӧбъяс да мудеръяс (1947ʼ вося небӧг)", "Висьтъяс (М. Горькӧй, 1947ʼ вося небӧг)", "Иванушка-дурачок йылысь (М. Горькӧй, 1947ʼ вося небӧг)", "Генерал Топтыгин (Н. А. Некрасов, 1947ʼ вося небӧг)", "Павлик Морозов (Е. Смирнов, 1940ʼ вося небӧг)", "Мюнхаузенлӧн приключениеяс (1938ʼ вося небӧг)", "Гулливер лиллипутъяс ордын (1936ʼ вося небӧг)"‎‎, "Ванька (1937ʼ вося небӧг)", "Гулливер великанъяс ордын (1939ʼ вося небӧг)"‎‎, "Тарас Бульба (Н. В. Гоголь, 1939ʼ вося небӧг)"‎‎, "Вий (Н. В. Гоголь, 1939ʼ вося небӧг)‎‎", "Миян туй (1957ʼ вося небӧг)", "Муму (И. С. Тургенев, 1957ʼ вося небӧг)‎‎", "Вокъяс-геройяс (П. Игнатов, 1947ʼ вося небӧг)", "Клятва (Ф. Гладков, 1947ʼ вося небӧг)", "Честнӧй кыв (Л. Пантелеев, 1947ʼ вося небӧг)", "Путивльсянь Карпатыӧдз (С. Ковпак, 1953ʼ вося небӧг)", "Борд пӧла каля (Г. Ивкучевалӧн 2022' вося небӧг)", "Удора-потанӧй (2024ʼ вося небӧг)", "Тундраса бияс (В. Юхнинлӧн 1949ʼ вося небӧг)", "Тундраса бияс (В. Юхнинлӧн 1951ʼ вося небӧг)", "СССР-лӧн история (1939ʼ вося небӧг)", "Кӧкъямыс смел будёновец (И. Е. Всеволожскӧй, 1963ʼ вося небӧг)",  "Гажа висьтъяс (Ю. Ермолаев, 1963ʼ вося небӧг)", "И жизнь, и слезы, и любовь (А. М. Бушеневалӧн 2021' вося небӧг)", "Вӧрса чай (Л. Палкинлӧн 2021' вося небӧг)", "Дзержинскӧй йылысь рассказъяс (Ю. П. Герман, 1953ʼ вося небӧг)", "Великӧй Ленин (Г. Кржижановскӧй, 1958ʼ вося небӧг)", "Ми мунам зоопаркӧ (А. Попов, 2023' вося небӧг)", "Рытъя кыаӧй менам... (Е. Козловалӧн 2023ʼ  вося небӧг)", "Коми войтырлӧн шусьӧгъяс да кывйӧзъяс (2023' вося небӧг)",  "Еджыд эрдъяса му вылын (2023' вося небӧг)", "Морт олӧм (А. Ельцовалӧн 2023ʼ вося небӧг)", "Габовсаяс (В. Лодыгинлӧн 2015ʼ вося небӧг)", "Евлог да сылӧн ёртъяс (И. Ногиевлӧн 2018ʼ вося небӧг)", "Коми попугайяс (В. Бабинлӧн 2018ʼ вося небӧг)", "Шонді дзирд (Э. Тимушевлӧн 2018ʼ вося небӧг)".

6.3. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельным номерам журнала "Войвыв кодзув" (2022 №"8-12, 2023 №№1-12, 2024. №№ 1-11).

6.4. Пополнение   указателей авторов и произведений журнала "Би кинь" материалом №№ 1-10 за 2024 г.

6.5. Создание и заполнение wiki-страниц с оглавлением по 34 номерам газет "Комі ԍікт" и "Југыԁ туј" за 1925-1926 гг. в онлайн-справочнике "Коми тӧданін".

6.6. Добавление в указатель публикаций газеты "Коми му" на справочном wiki-ресурсе "Коми тӧданін" содержания номеров за 2023 год.

6.7. Пополнение страниц авторов и переводчиков ссылками на издания, добавленные за истекший период.

7. Пополнение лексической базы FU-Lab:

7.1. Лингвистическая разметка электронной версии коми-пермяцкого словаря для его добавления на сайт «Онлайн словари FU-Lab».

7.2. Размещение "Коми-пермяцко-русского словаря" на сайте "Онлайн-словари FU-Lab" и редактирование его текста.

7.3. Техническая разметка "Коми-пермяцко-русского словаря": замена тильды на слово, расстановка гиперссылок, добавление строки транскрипции, заполнение транскрипции, оформление отступов.

8. Помощь коллегам в других регионах и сторонних организациях:

8.1. Разбивка на произведения, распределение по отдельным файлам и метаразметка русскоязычных художественных текстов, подготовленных в рамках создания параллельного корпуса на коми и русском языках для коллег в других регионах, занимающихся аналогичной работой.

8.2. Разбивка и первичное выравнивание по предложениям в программе WinMerge с русскоязчыным оригиналом текста удмуртского издания "Л. Воронкова. Пичи нылъёс школае мыно" (1953) как образец данного вида работы для сектора языка УИИЯЛ УдмФИЦ УрО РАН.

8.3. Обработка в программе ABBYY FineReader и создание pdf копии научного издания "Károly Rédei. Zyrian texts" (1996) по просьбе сектора языка ФИЦ Коми НЦ УрО РАН.

8.4. Пополнение коми-пермяцкого корпуса текстами, предоставленными ГБОУ ДПО «Коми-Пермяцкий институт повышения квалификации работников образования», а также комиязычными текстами коми-пермяцких групп социальной сети ВКонтакте за текущий год.

9. Создание мультиязычного корпуса по пермским языкам:

9.1. Создание первичной версии интерфейса параллельного корпуса по пермским языкам.

9.2. Продолжение распознавания и вычитки в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице:  "Piţu-Əꞑə. Priroda tədmalan kꞑiga. V-əd vo" (1932); "В. V. Vşesvjatskij. Вotaꞑika." (1934); "M. J. Cuzmer. Zoologia" (1934).

9.3. Конвертация текста коми-пермяцкого издания на латинице "В. V. Vşesvjatskij. Вotaꞑika." (1934) на современную графику, его обработка в программе LibreOffice Writer и приведение к нормам современной орфографии и выравнивание по предложениям в программе WinMerge русскоязычного текста издания "Б. Всесвятский. Ботаника" (1934)  с коми, коми-пермяцким и удмуртским переводами.

10. По лингвистическому ресурсу "Коми кыв":

10.1. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий сборников из серии "Пермистика": "Пермистика" (1987), "Пермистика 2" (1991), "Пермистика-6 (2000)", "Пермистика-7" (1999), "Пермистика-8" (2001), "Пермистика-9" (2002), "Пермистика-10 (2009)","Пермистика XI" (2006), "Пермистика-12" (2008), "Пермистика-13" (2012) "Пермистика XIV" (2012).

10.2. Создание общего указателя по сборникам "Пермистика" на сайте "Коми лингвистика".

10.3. Разработка сайта "Пермистика" (http://permistica.komikyv.com/) с функцией поиска по различным критериям и возможностью добавления pdf статей.

10.4. Создание унифицированного списка статей сборников "Пермистика" для возможности автоматической загрузки.

10.5. Разбивка pdf файлов сборников "Пермистика" на отдельные файлы статей, их обработка и загрузка на сайт "Пермистика".

10.6. Создание и отладка поискового сервиса и ссылок с сайта "Пермистика" на отдельные файлы.

10.7. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий монографий и учебных пособий д. филол. наук В. М. Лудыковой, предоставленных автором: "Роль прилагательного в формировании смысла высказывания (на материале коми языка)" (2001), "Местоимение и прилагательное в грамматической системе коми и русского языков" (2003), "Адъективное определение в агглютинативных языках (на материале коми языка)" (2008), "Глагол в предложении коми языка" (2012), "Литературный коми язык: история и современное состояние (социолингвистический аспект)" (2014), "Коми кывйысь прöстöй сёрникузя видлалöм : студентъяслы асшöра велöдчöм могысь методическöй индöдъяс" (2007), "Коми кывйын кывтэчас да прöстöй сёрникузя" (2009),  "В. М. Лудыкова. Ӧнія коми кыв. Синтаксис" (2010). Размещение указанных pdf файлов на сервере и создание ссылок на них с сайта "Коми лингвистика".

11. Пополнение словарной базы средства проверки правописания Hunspell:

11.1. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.

11.2. Подготовительная работа по созданию средства проверки коми орфографии для популярных браузеров.

12. Иное

12.1. Создание видеоролика по установке на мобильный телефон коми раскладки для Яндекс Клавиатуры.

12.2. Распространение комиязычного контента в соц. сетях.

12.3. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

12.4. Оптимизация настроек сайтов лаборатории для повышения их позиций при индексации в поисковых системах.

12.5. Адаптивная HTML-вёрстка новой структуры группы сайтов fu-lab.ru.

13. Участие в мероприятиях и выступления в сми:

13.1. Участие в съёмках для передачи "Ас му вылын" (телеканал "Коми гор", эфир 21.03.2024).

13.2. Проведение организационного собрания для переводчиков предложений, предоставленных для перевода на коми язык МКАO «Яндекс», составление и размещение инструкции по переводу данных текстов на вики ресурсе wiki.fu-lab.ru, распределение и рассылка материала переводчикам (25.01.2024).

13.3. Выступление перед слушателями курсов коми языка, проводящихся в ГАУ РК "Дом дружбы народов Республики Коми" (14.02.2024).

13.4. Участие в V международной научно-практической конференции «Электронная письменность в России: опыт, задачи, векторы развития» (Йошкар-Ола, 21-22.02.2024), выступление в Марийском научно-исследовательском институте языка, литературы и истории им. В.М. Васильева с докладом на тему "Процесс формирования текстовой базы для параллельного русско-коми корпуса и автоматического переводчика" (22.02.2024).

13.5. Презентация продуктов ЦИЯТ и проведения мастер-класса на Республиканском фестивале мастер-классов среди педагогических работников Республики Коми по сохранению коми языка, культуры и традиций коми народа (с. Мохча, 05.04.2024).

13.6. Проведение мастер-класса в Сыктывкарском гуманитарно-педагогическом колледже по ознакомлению студентов дошкольного отделения с онлайн-ресурсами лаборатории FU-Lab по коми языку и другим комиязычным ресурсам интернета (13.04.2024).

13.7. Участие в фестивале национальных литератур народов России "Красная площадь" (Москва, 6-9.06.2024) и выступление в рамках дискуссии «Возможности IT в сфере поддержки и развития родных языков» с презентацией ресурсов Межрегиональной лаборатории информационной поддержки функционирования финно-угорских языков (Москва, 08.06.2024).

13.8. Проведение семинара для представителей рабочей группы по созданию корпуса коми-пермяцкого языка (Сыктывкар, 15.06.2024).

13.9. Выступление с информацией о работе лаборатории FU-Lab в программе "Ми тані олам" на КРТК "Юрган", эфир 24.06.2024.

13.10. Проведение презентации корпуса коми-пермяцкого языка в рамках конференции «Развитие коми-пермяцкой письменности и коми-пермяцкого языка» (Кудымкар, 06.12.2024).

13.11. Участие в работе ежегодной конференции "Языковая политика в Российской Федерации", организованной Федеральным агентством по делам национальностей Российской Федерации (Москва, 10-11 декабря 2024 года), выступление на панельной сессии "Механизмы поддержки и развития языков народов Российской Федерации в цифровом пространстве" с презентацией сервиса сортировки списков на языках народов РФ.

13.12. Переговоры с представителями МКАО "Яндекс" о передаче дополнительного коми материала для работы по включению коми языка в онлайн сервис "Яндекс-переводчик". (Москва, 12.12.2024).

2024ʼ вося нёльӧд кварталысь отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 13:42 18.12.2024

2024-09-23 – 2024-12-20

 

2. Работа в рамках создания параллельного корпуса (kv-ru) и машинного переводчика:

2.1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.

2.2. Сбор оригинальных и переводных текстов нормативно-правовых актов Республики Коми на русском языке за 2023 год, создание метаразметок для корпуса коми языка. Выравнивание нормативно-правовых актов Республики Коми на коми и русском языках за 2023 год для параллельного корпуса.

2.3. Перевод с помощью телеграм-бота на коми язык новостных текстов сайта komiinform.ru за 2024.07.02 и 2024.07.03, редактирование коми текстов для включения в базу переводчика.

2.4. Выравнивание по предложениям в программе WinMerge с русскоязычным оригиналом текста комиязычного издания "Иосиф Виссарионович Сталин: краткӧй биография" (1947).

2.5. Приобретение, сканирование, обработка и распознавание в программе ABBYY FineReader, создание pdf копий, обработка в программе LibreOffice Writer текстов русскоязычных учебников, имеющих коми переводы: "Б. В. Всесвятский. Ботаника" (1934), "Б. В. Всесвятский. Ботаника" (1936), "М. Я. Цузмер. Зоология" (1936), "А. Н. Кабанов. Анатомия" (1937).

2.6. Разбивка на строки текстов учебников "M. J. Cuzmer. Zoologija" (1933) / "М. Я. Цузмер. Зоология" (1933) и B. V. Vşeşvjatskij. Вotaꞑika (1934) / "Б. В. Всесвятский. Ботаника" (1934),  на коми (в совр. орфографии) и русском языках и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.

2.7. Завершение распознавания и вычитки в программе ABBYY FineReader, обработка в программе LibreOffice Writer переводных текстов учебников на молодцовице "Б. В. Вԍеԍвјатскіј. Ботаԋіка" (1936), "М. Ј. Цузмер. Зоологіја" (1936); конвертация текстов на современную графику, повторная вычитка и корректирование по современной орфографии в программе LibreOffice Writer, разбивка на предложения и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Завершение распознавания и вычитки в программе ABBYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) текста комиязычного издания "В. Лодыгин. Габовсаяс" (2015).

3.2. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer  текста комиязычных изданий "В. Юхнин. Тундраса бияс. Первой часть" (1949), "В. Юхнин. Тундраса бияс. Мӧд часть" (1951).

3.3. Извлечение из pdf файла текстов, проверка орфографии, обработка в программе LibreOffice Writer комиязычного текста издания "А. Мишарин. Кор лэбзьӧ коляоз" (2016).

3.4. Создание фотокопий статей номеров газеты "Югыд туй" за октябрь-декабрь 1990 года. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" (1990. №№111-152) и их обработка в программе LibreOffice Writer. Редактирование текстов газеты (1990. №№ 105-151) для включения в корпус коми языка.

3.5. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2024. №39-51);  журналов "Йӧлӧга" (2024. №№ 7-11), "Войвыв кодзув" (2024. №№ 5-11), "Чушканзі" (2021. №1; 2022. №№1-12; 2023 №№ 1-12, 2024. №№ 1-11) и "Би кинь" (2020. №№11, 12; 2024. №№1-11); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).

3.6. Продолжение технической работы над историческим разделом корпуса коми языка.

3.7. Добавление в корпус коми языка текстов, обработанных за отчетный период.

4. Текстовое пополнение молодцовского и латинского корпуса:

4.1. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926 №№ 13-16), их обработка в программе LibreOffice Writer и включение в молодцовский корпус;

4.2. В молодцовский корпус добавлены также тексты изданий  "Б. В. Вԍеԍвјатскіј. Ботаԋіка" (1936), "М. Ј. Цузмер. Зоологіја" (1936).

4.3. В латинский корпус добавлены тексты изданий "M. J. Cuzmer. Zoologija" (1933), "B. V. Vşeşvjatskij. Вotaꞑika" (1934).

5. Пополнение онлайн библиотеки "Коми гижӧд":

5.1. Размещение в онлайн библиотке "Коми гижӧд" 71 произведения из сборника "В. Г. Лодыгин. Габовсаяс" (2015).

5.2. Размещение в онлайн библиотеке "Коми гижӧд" 51 произведения из журналов:  Алёна Ельцова: стихотворения "Каня-понъя", "Пӧжасьысьяс", "Кӧза", "Пон да кань"; "Поэзия", "Кымӧр-кунӧр", "Китыр лым чирйӧн али кодзулӧн...", "Вой кежлас ывлаын ёна на кынтавлӧ...", "Рӧмдас да, керкаысь ывлаӧ пета...", "Югыдлӧз", "Турунъяс вӧрзьӧны пемыд му пыдӧсын...", "Йӧлӧга шыӧн таланьӧ коркӧ волы...", "Эз жарӧн, Эз косӧн...", "Вылісянь сьылӧмӧн му вылӧ...", "Сьыв мен асъядорыс, шоныд тӧвру...", "Усь, лымйӧй, усь, — мед менам сьӧлӧм югзяс...", "Саридз";  Алёна Старцева: "Ӧтик-мӧтик", "Аддзӧмтор"; Алёна Шомысова: "Каньлы ним",  "Льӧм дзоридзалігӧн", "Мӧвп", "Жытник", "Волсяса вичко", "Пес чипас", переводные сказки "Миша ошпи да Би кинь", "Дивӧ-дзоридз"; Баженова Ольга: стихотворение "Чушканзі";  Василий Лодыгин: стихотворения "Медсяяс", "Муса чужанін";  Евгений Игушев: рассказ "Сюрук Ӧксялӧн ыжпи"; Елена Афанасьева: "Вӧрса гусяторъяс"; Зарни Люся: стихотворения "Аканьяс", "Батьӧ ньӧбис телевизор"; "Сашук", "Ва пельса", "Гӧстя", "Менам ёрт", "Мичаа шырӧм", "Нӧдкывъяс", "Пудъясянкывъяс", "Кывбертласъяс"; рассказ "Тыдавтӧм кымӧр";  Иван Ногиев: рассказы "Гӧрд пӧк", "Крукасин"; "Мык",  "Транспортир",  "Патер", "Сконйыштчис"; Нина Обрезкова: "Пӧчлы отсӧг"; Прокопий Габов: статья "Андаман саридзса Пхукетын дас лун";  Серафим Попов: стихотворения "Еджыд ывла", "Ичӧт лыддьысьысь".

5.3. Размещение в онлайн библиотеке "Коми гижӧд" коми текстов 4 номеров газеты "Комі ԍікт"  за 1925 г. в переводе на современную графику.

6. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

6.1. Создание общего указателя публикаций журнала «Войвыв кодзув» за 2014-2024 год.

6.2. Создание указателей содержания по отдельным номерам журнала "Войвыв кодзув" (2024 №№7-11).

6.3. Пополнение   указателей авторов и произведений журнала "Би кинь" материалом №№ 1-10 за 2024 г.

6.4. Создание и заполнение wiki-страниц с оглавлением по отдельным номерам газеты "Комі ԍікт" (1926 №№ 13-16).

6.5. Создание и заполнение отдельных страниц по книжным изданиям на коми языке: "Евлог да сылӧн ёртъяс (И. Ногиевлӧн 2018ʼ вося небӧг)", "Коми попугайяс (В. Бабинлӧн 2018ʼ вося небӧг)", "Шонді дзирд (Э. Тимушевлӧн 2018ʼ вося небӧг)".

6.6. Внесение правок на страницы авторов: "Старцева Алёна Николаевна", "Шомысова Алёна Александровна", "Обрезкова Нина Александровна",  "Афанасьева Елена Евгеньевна", "Вурдов Алексей Иванович", "Попов Геннадий Иванович", "Габов Прокопий Валентинович", "Баженова Ольга Николаевна", "Ельцова Алёна", "Зарни Люся", "Ногиев Иван Иванович", "Попов Серафим Алексеевич", "Игушев Евгений Александрович" справочного wiki-ресурса "Коми тӧданін" с созданием ссылок на произведения, размещенные в коми онлай библиотеке "Коми гижӧд".

7. Пополнение лексической базы FU-Lab:

7.1. Внесение исправлений в онлайн-словарь "Перем коми кывкуд" на сайте dict.komikyv.org.

8. Помощь коллегам в других регионах и сторонних организациях:

8.1. Пополнение коми-пермяцкого корпуса текстами, предоставленными ГБОУ ДПО «Коми-Пермяцкий институт повышения квалификации работников образования», а также комиязычными текстами коми-пермяцких групп социальной сети ВКонтакте за текущий год.

9. Развитие мультиязычного корпуса по пермским языкам:

9.1. Конвертация текста коми-пермяцкого издания на латинице "В. V. Vşesvjatskij. Вotaꞑika." (1934) на современную графику, его обработка в программе LibreOffice Writer и приведение к нормам современной орфографии и выравнивание по предложениям в программе WinMerge русскоязычного текста издания "Б. Всесвятский. Ботаника" (1934)  с коми, коми-пермяцким и удмуртским переводами.

10. По лингвистическому ресурсу "Коми кыв":

10.1. Разработка сайта "Пермистика" (http://permistica.komikyv.com/) с функцией поиска по различным критериям и возможностью добавления pdf статей.

10.2. Создание унифицированного списка статей сборников "Пермистика" для возможности автоматической загрузки.

10.3. Разбивка pdf файлов сборников "Пермистика" на отдельные файлы статей, их обработка и загрузка на сайт "Пермистика".

10.4. Создание и отладка поискового сервиса и ссылок с сайта "Пермистика" на отдельные файлы.

11. Пополнение словарной базы средства проверки правописания Hunspell:

11.1. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.

11.2. Подготовительная работа по созданию средства проверки коми орфографии для популярных браузеров.

12. Иное

12.1. Распространение комиязычного контента в соц. сетях.

12.2. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

13. Участие в мероприятиях и выступления в сми:

13.1. Проведение презентации корпуса коми-пермяцкого языка в рамках конференции «Развитие коми-пермяцкой письменности и коми-пермяцкого языка» (Кудымкар, 06.12.2024).

13.2. Участие в работе ежегодной конференции "Языковая политика в Российской Федерации", организованной Федеральным агентством по делам национальностей Российской Федерации (Москва, 10-11 декабря 2024 года), выступление на панельной сессии "Механизмы поддержки и развития языков народов Российской Федерации в цифровом пространстве" с презентацией сервиса сортировки списков на языках народов РФ.

13.3. Переговоры с представителями МКАО "Яндекс" о передаче дополнительного коми материала для работы по включению коми языка в онлайн сервис "Яндекс-переводчик". (Москва, 12.12.2024).

2024ʼ ӧшым тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 11:58 18.12.2024

2024-11-25–2024-12-20.

  1.  
  2. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  3. Разбивка текстов учебника "M. J. Cuzmer. Zoologija" (1933) / "М. Я. Цузмер. Зоология" (1933) на коми (в совр. орфографии) и русском языках на строки и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.
  4. Завершение распознавания и вычитки в программе ABBYY FineReader, обработка в программе LibreOffice Writer переводных текстов учебников на молодцовице "Б. В. Вԍеԍвјатскіј. Ботаԋіка" (1936), "М. Ј. Цузмер. Зоологіја" (1936); конвертация текстов на современную графику, повторная вычитка и корректирование по современной орфографии в программе LibreOffice Writer, разбивка на предложения и выравнивание с русскими оригиналами в программе WineMerge. Добавление текстов на молодцовице в молодцовский корпус, а выравненных текстов в параллельный русско-коми корпус.
  5. Распознавание и вычитка в программе ABBYY FineReader, обработка  в программе LibreOffice Writer текстов текстов газеты "Югыд туй" за 1990 г. (№№ 141-152), обработка их в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики,  метаразметка и расстановка языковых тэгов). Редактирование текстов №№137-151 и включение их в корпус коми языка.
  6. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2024. №48-51), номеров журналов "Войвыв кодзув" (2024. № 11), "Йӧлӧга" (2024. № 11),  "Чушканзі" (2021. №1; 2022. №№1-12; 2023. №№1-9; 2024 № 11) ) и "Би кинь" (2020. №№11, 12; 2024. № 11); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. № 16), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  8. Завершение создания общего указателя публикаций журнала «Войвыв кодзув» за 2014-2024 год  на справочном wiki-ресурсе "Коми тӧданін".
  9. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельному номеру журнала "Войвыв кодзув" (2024 № 11).
  10. Размещение произведений в онлайн-библиотеке "Коми гижӧд": Прокопий Габов: статья "Андаман саридзса Пхукетын дас лун"; Баженова Ольга: стихотворение "Чушканзі"; Алёна Ельцова: стихотворения "Поэзия", "Кымӧр-кунӧр", "Китыр лым чирйӧн али кодзулӧн...", "Вой кежлас ывлаын ёна на кынтавлӧ...", "Рӧмдас да, керкаысь ывлаӧ пета...", "Югыдлӧз", "Турунъяс вӧрзьӧны пемыд му пыдӧсын...", "Йӧлӧга шыӧн таланьӧ коркӧ волы...", "Эз жарӧн, Эз косӧн...", "Вылісянь сьылӧмӧн му вылӧ...", "Сьыв мен асъядорыс, шоныд тӧвру...", "Усь, лымйӧй, усь, — мед менам сьӧлӧм югзяс...", "Саридз"; Зарни Люся: рассказ "Тыдавтӧм кымӧр";  Зарни Люся: стихотворения "Аканьяс", "Батьӧ ньӧбис телевизор"; В. Лодыгин: стихотворения "Медсяяс", "Муса чужанін"; Иван Ногиев: рассказы "Гӧрд пӧк", "Крукасин"; Евгений Игушев: рассказ "Сюрук Ӧксялӧн ыжпи"; Серафим Попов: стихотворения "Еджыд ывла", "Ичӧт лыддьысьысь"; Алёна Ельцова; стихотворения "Пӧжасьысьяс", "Кӧза", "Пон да кань";
  11. Внесение правок на страницы "Габов Прокопий Валентинович", "Баженова Ольга Николаевна", "Ельцова Алёна", "Зарни Люся", "Ногиев Иван Иванович", "Попов Серафим Алексеевич", "Игушев Евгений Александрович" справочного wiki-ресурса "Коми тӧданін" с созданием ссылок на произведение, размещенные в коми онлай библиотеке "Коми гижӧд".
  12. Внесение исправлений в онлайн-словарь "Перем коми кывкуд" на сайте dict.komikyv.org.
  13. Пополнение коми-пермяцкого корпуса текстами, предоставленными ГБОУ ДПО «Коми-Пермяцкий институт повышения квалификации работников образования».
  14. Продолжение технической работы над историческим разделом корпуса коми языка.
  15. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  16. Распространение комиязычного контента в соц. сетях.
  17. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  18. Проведение презентации корпуса коми-пермяцкого языка в рамках конференции «Развитие коми-пермяцкой письменности и коми-пермяцкого языка» (Кудымкар, 06.12.2024)
  19. Участие в работе ежегодной конференции "Языковая политика в Российской Федерации", организованной Федеральным агентством по делам национальностей Российской Федерации (Москва, 10-11 декабря 2024 года), выступление на панельной сессии "Механизмы поддержки и развития языков народов Российской Федерации в цифровом пространстве" с презентацией сервиса сортировки списков на языках народов РФ.
  20. Переговоры с представителями МКАО "Яндекс" о передаче дополнительного коми материала для работы по включению коми языка в онлайн сервис "Яндекс-переводчик".
FU-Lab. 2024.12.16.-2024.12.20

опубликовал Öньö Лав в 11:23 18.12.2024

​В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.12.16.-2024.12.20

  1.  
  2. Вычитка в программе LibreOffice Writer конвертированных на современную графику текстов учебников "Б. В. Вԍеԍвјатскіј. Ботаԋіка" (1936), "М. Ј. Цузмер. Зоологіја" (1936). Выравнивание текстов по предложениям с русскими оригиналами в программе WineMerge. Добавление текстов на молодцовице в Молодцовский корпус, а выравненных текстов в русско-коми корпус.
  3. Распознавание и вычитка в программе ABBYY FineReader текстов газеты «Югыд туй» (1990. №№ 145, 150, 151, 152), обработка их в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики,  метаразметка и расстановка языковых тэгов).
  4. Редактирование текстов газеты «Югыд туй» №№ 145-151 за  1990 год.
  5. Извлечение из pdf файлов текстов свежего номера газеты "Коми му"  (2024. №51) и номеров журнала "Чушканзі" (2021. №1, 2022. № 1-3); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики,  метаразметка и расстановка языковых тэгов).
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. № 16), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  7. Размещение произведений в онлайн-библиотеке "Коми гижӧд": Серафим Попов: стихотворения "Еджыд ывла", "Ичӧт лыддьысьысь"; Зарни Люся: стихотворения "Аканьяс", "Батьӧ ньӧбис телевизор"; Алёна Ельцова; стихотворения "Пӧжасьысьяс", "Кӧза", "Пон да кань";
  8. Внесение правок в страницы "Зарни Люся", "Попов Серафим Алексеевич", "Ельцова Алёна" на справочном wiki-ресурсе "Коми тӧданін" с созданием ссылок на произведения.
  9. Продолжение технической работы над историческим разделом корпуса коми языка.
  10. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
Яндекс.Метрика