FU-Lab. 2023.11.27-2023.12.01

опубликовал Öньö Лав в 20:35 10.12.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.11.27-2023.12.01.

  1.  
  2. Корректирование коми и русского новостного массива радио "Коми гор" за 2014, 2016 и 2017 гг.
  3. Создание метаразметок текстов БОП, содержащих НПА РК за 2021 и 2022 годы, для Корпуса коми языка.
  4. Обработка текстов БОП, содержащих НПА РК за 2021 и 2022 годы, для Корпуса коми языка.
  5. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2023. № 48).
  6. Выступление на семинаре "Об использовании информационных и комуникационных технологий на уроках коми-пермяцкого языка" с докладом "Коми кыв сьӧрті электроннӧй ресурссэз: клавиатура, спелл-чекер, кыв корпус" (Кудымкар, 2023-11-28).
  7. Проведение лекции для студентов третьего курса коми-пермяцко-русского отделения Пермского государственного гуманитарно-педагогического университета на тему "Онлайн ресурсы и электронные разработки по коми языку для Республики Коми и Пермского края" (2023-11-30).
  8. Распространение комиязычного контента в соц. сетях.
  9. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.12.04.-2023.12.08.

опубликовал Öньö Лав в 3:07 08.12.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.12.04.-2023.12.08.

  1.  
  2. Метаразметка и выравнивание текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2021 и 2022 гг.
  3. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №49); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) и загрузка в корпус коми языка.
  4. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-10-03, 1925-10-04, 1925-10-06, 1925-10-08, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  5. Пополнение онлайн-библиотеки "Коми гижӧд" новыми произведениями автора Елена Афанасьева.
  6. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка  текстов учебников на коми языке:  Виткович Н. Е. География : нач. школаса 4-ӧд кл. учебник (1956) и  Заславскӧй И. И., Герасимов Т. П. Физическӧй география : начальнӧй курс : семилетньӧй да средньӧй школаса 5-ӧд кл. учебник (1963).
  7. Создание ссылок на ресурсы Национальной библиотеки Удмуртской Республики с таблиц удмуртоязычных книжных изданий 1946-1960 гг. на сайте udmwiki.fu-lab.ru.
  8. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  9. Создание инструкции по включению модуля проверки орфографии регионального языка в магазин расширений браузера Mozilla Firefox.
  10. Добавление в магазин расширений браузера  Mozilla Firefox лугово-марийского и горно-марийского модулей проверки орфографии.
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  13. Изучение языка программирования Python.
FU-Lab. 2023.11.20.-2023.11.24.

опубликовал Öньö Лав в 18:15 23.11.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.11.20.-2023.11.24.

 

  1.  
  2. Корректирование коми и русского новостного массива радио "Коми гор" за 2014, 2016 и 2017 гг.
  3. Сборка и предварительная обработка текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2021 и 2022 гг. для дальнейшей метаразметки и выравнивания.
  4. Извлечение из pdf файлов текстов свежего номеров газеты "Коми му" (2023. № 47) и журнала "Войвыв кодзув" (2023. №10); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) и загрузка в корпус коми языка.
  5. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-09-29, 1925-10-01, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  6. Пополнение онлайн-библиотеки "Коми гижӧд" новыми произведениями автора Елена Афанасьева.
  7. Завершение работы над  новым сервисом сортировки списков для региональных языков РФ, ссылка на ресурс разослана в регионы для тестирования.
  8. Создание расширения для проверки удмуртской орфографии в браузере FireFox.
  9. Пополнение словарных баз коми и удмуртского спелл-чеккеров hunspell новой лексикой, выявленной в обрабатываемых текстах.
  10. Обновление коми и удмуртского контента в Онлайн сервисе проверки правописания.
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  13. Изучение языка программирования Python.
2023ʼ вӧльгымся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 20:25 21.11.2023

25.10.2023–24.11.2023.

  1.  
  2. Сборка и предварительная обработка текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2021 и 2022 гг. для дальнейшей метаразметки и выравнивания.
  3. Выборочный перевод русскоязычных новостных текстов издания "Коммерсант" на коми язык для параллельного корпуса на коми и русском языках.
  4. Редактирование словника большого коми-русского словаря для параллельного корпуса.
  5. Корректирование коми и русского новостного массива радио "Коми гор" за 2014, 2015, 2016 и 2017 гг.
  6. Сканирование, создание pdf-файла, распознавание и вычитка в программе ABBYY FineReader текста книжного издания "Ф. В. Плесовский. Комиын овъяс" (1997).
  7. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №№43-47), журналов "Йӧлӧга" (2023. №№9, 10) и "Войвыв кодзув" (2023. №№4-10); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) .
  8. Загрузка в основной корпус коми языка вновь обработанных текстов и обновление корпуса.
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-09-17, 1925-09-19, 1925-09-22, 1925-09-24, 1925-09-26, 1925-09-29, 1925-10-01, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  10. Пополнение коми-пермяцкого корпуса текстами, извлеченными из pdf файлов, предоставленных Сектором научно-методической и издательской деятельности ГКБУК «Коми-Пермяцкий этнокультурный центр», а также комиязычными текстами коми-пермяцких групп социальной сети ВКонтакте за текущий год.
  11. Создание нового сервиса сортировки для региональных языков РФ.
  12. Создание погодовых таблиц по книжным изданиям на удмуртском языке за 1946-2017 гг. для вики-ресурса по удмуртской письменности на основе электронного каталога РНБ и списка, предоставленном сотрудниками отдела филологических исследований УИИЯЛ УдмФИЦ УрО РАН.
  13. Пополнение словарных баз коми, коми-пермяцкого и удмуртского спелл-чеккеров hunspell новой лексикой, выявленной в обрабатываемых текстах.
  14. Обновление коми, коми-пермяцкого и удмуртского контента в Онлайн сервисе проверки правописания.
  15. Описание состояния и перспектив развития удмуртского спеллера hunspell на wiki-ресурсе wiki.fu-lab.ru.
  16. Распространение комиязычного контента в соц. сетях.
  17. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  18. Изучение языка программирования Python.
  19. Выступление перед участниками блог-тура "В гостях у носителей языка" 27 октября 2023 года в г. Сыктывкар.
FU-Lab. 2023.11.13.-2023.11.17.

опубликовал Öньö Лав в 1:21 17.11.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.11.13.-2023.11.17.
    

  1.  
  2. Редактирование словника большого коми-русского словаря для параллельного корпуса.
  3. Извлечение из pdf файлов текстов свежего номеров газеты "Коми му" (2023. № 46), журналов "Йӧлӧга" (2023. №9) и "Войвыв кодзув" (2023. №№ 7, 8, 9); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) и загрузка в корпус коми языка.
  4. Корректирование коми и русского новостного массива радио "Коми гор" за 2015 и 2016 гг.
  5. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-09-26, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  6. Продолжение работы над  новым сервисом сортировки списков для региональных языков РФ: решена проблема игнорирования макрона, включены долганский и нанайский языки, добавлены опции разбивки по словам и приведения к нижнему регистру, написана и размещена на вики-ресурсе wiki.fu-lab.ru инструкция по работе с сервисом сортировки.
  7. Создание погодовых таблиц по книжным изданиям на удмуртском языке за 1946-2017 гг. для вики-ресурса по удмуртской письменности на основе электронного каталога РНБ и списка, предоставленном сотрудниками отдела филологических исследований УИИЯЛ УдмФИЦ УрО РАН.
  8. Пополнение словарных баз коми и удмуртского спелл-чеккеров hunspell новой лексикой, выявленной в обрабатываемых текстах.
  9. Обновление коми и удмуртского контента в Онлайн сервисе проверки правописания.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  12. Изучение языка программирования Python.
FU-Lab. 2023.11.07.-2023.11.10.

опубликовал Öньö Лав в 23:19 09.11.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.11.07.-2023.11.10.
 

  1.  
  2. Редактирование словника большого коми-русского словаря для параллельного корпуса.
  3. Извлечение из pdf файлов текстов свежего номеров газеты "Коми му" (2023. № 45)  и журнала "Войвыв кодзув" (2023, №№ 5, 6); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-09-22 и 1925-09-24, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  5. Сканирование, создание pdf-файла, распознавание и вычитка в программе ABBYY FineReader текста книжного издания "Ф. В. Плесовский. Комиын овъяс" (1997).
  6. Загрузка в основной корпус коми языка вновь обработанных текстов и обновление корпуса.
  7. Продолжение работы над  новым сервисом сортировки списков для региональных языков РФ: включены абхазо-адыгские и нахско-дагестанские литературные языки, решена проблема сортировки в разных регистрах, добавлена опция сохранения последнего использованного языка по умолчанию, встроена функция автоматической замены латинских букв кириллическими.
  8. Пополнение коми-пермяцкого корпуса текстами, извлеченными из pdf файлов, предоставленных Сектором научно-методической и издательской деятельности ГКБУК «Коми-Пермяцкий этнокультурный центр», а также комиязычными текстами коми-пермяцких групп социальной сети ВКонтакте за текущий год.
  9. Пополнение словарных баз коми, коми-пермяцкого и удмуртского спелл-чеккеров hunspell новой лексикой, выявленной в обрабатываемых текстах.
  10. Обновление коми, коми-пермяцкого и удмуртского контента в Онлайн сервисе проверки правописания.
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  13. Изучение языка программирования Python.
FU-Lab. 2023.10.30.-2023.11.03.

опубликовал Öньö Лав в 11:09 03.11.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.10.30.-2023.11.03.
 

  1.  
  2. Выборочный перевод русскоязычных новостных текстов издания "Коммерсант" на коми язык для параллельного корпуса на коми и русском языках.
  3. Редактирование словника большого коми-русского словаря для параллельного корпуса.
  4. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. № 44) и обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-09-19, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  6. Загрузка в основной корпус коми языка вновь обработанных текстов и обновление корпуса.
  7. Создание нового сервиса сортировки для региональных языков РФ.
  8. Пополнение словарных баз коми, коми-пермяцкого и удмуртского спелл-чеккеров hunspell новой лексикой, выявленной в обрабатываемых текстах.
  9. Обновление коми, коми-пермяцкого и удмуртского контента в Онлайн сервисе проверки правописания.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  12. Изучение языка программирования Python.
FU-Lab. 2023.10.23.-2023.10.27.

опубликовал Öньö Лав в 11:22 27.10.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.10.23.-2023.10.27.

 

  1.  
  2. Выборочный перевод русскоязычных новостных текстов издания "Коммерсант" на коми язык для параллельного корпуса на коми и русском языках.
  3. Редактирование словника большого коми-русского словаря для параллельного корпуса.
  4. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. № 43) и обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-09-17, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  6. Загрузка в основной корпус коми языка вновь обработанных текстов и обновление корпуса.
  7. Пополнение сервиса сортировки списков по алфавиту материалами башкирского, бурятского, тувинского, хакасского, чувашского и чукотского языков.
  8. Создание расширения для проверки коми-пермяцкой орфографии в браузере FireFox.
  9. Пополнение словарных баз коми, коми-пермяцкого и удмуртского спелл-чеккеров hunspell новой лексикой, выявленной в обрабатываемых текстах.
  10. Обновление коми, коми-пермяцкого и удмуртского контента в Онлайн сервисе проверки правописания.
  11. Описание состояния и перспектив развития удмуртского спеллера hunspell на wiki-ресурсе wiki.fu-lab.ru.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  14. Изучение языка программирования Python.
  15. Выступление на мероприятии IV Круглый стол «Сохранение родных языков в условиях глобализации», проведенном Полномочным представительством Республики Татарстан в Российской Федерации 20 октября 2023 года в Татарском культурном центре г. Москва.
  16. Выступление перед участниками блог-тура "В гостях у носителей языка" 27 октября 2023 года в г. Сыктывкар.
2023ʼ йирымся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 23:22 23.10.2023

  1. Выборочный перевод русскоязычных новостных текстов издания "Коммерсант" и информационного агентства "Интерфакс" на коми язык для параллельного корпуса на коми и русском языках.
  2. Редактирование словника коми-русского словаря для параллельного корпуса.
  3. Сканирование в программе ABBYY FineReader переводных книжных изданий на коми языке: "Венгр литератураысь 12 медся мича висьт" (2015), "Рӧднӧй сёрни: начальнӧй школаса мӧд класслы лыддьысян книга" (1956), "Рӧднӧй сёрни: начальнӧй школаса нёльӧд класслы лыддьысян книга" (1961) , "А. Авдеенко.  Карпатскӧй бипур дорын" (1962), Т. Гончаренко "Овтӧм ді вылын" (1962), "Ю. Сотник. Кыдзи ме олі ас кежын" (1961) и создание их электронных копий в формате pdf.
  4. Распознавание и вычитка в программе ABBYY FineReader текстов книжных изданий "Рӧднӧй сёрни: начальнӧй школаса нёльӧд класслы лыддьысян книга" (1961), "Рӧднӧй сёрни: начальнӧй школаса мӧд класслы лыддьысян книга" (1956), А.  Авдеенко "Карпатскӧй бипур дорын" (1962), Т. Гончаренко "Овтӧм ді вылын" (1962), Ю. Сотника "Кыдзи ме олі ас кежын" (1961) на коми языке, проверка орфографии, обработка распознанного текста в программе LibreOffice Writer.
  5. Создание подробных метаразметок для текста учебника "Рӧднӧй сёрни: начальнӧй школаса нёльӧд класслы лыддьысян книга" (1961) и "Рӧднӧй сёрни:  начальнӧй школаса мӧд класслы лыддьысян книга" (1956) на коми языке.
  6. Сбор русскоязычных текстов оригинала учебника "Родная речь. Книга для чтения во 2 классе" (1954).   
  7. Разбивка на строки текстов книжных изданий  "Рӧднӧй сёрни: начальнӧй школаса мӧд  класслы лыддьысян книга" (1956) и "Родная речь. Книга для чтения во 2  классе" (1954), "Ю. Сотник. Кыдзи ме олі ас кежын" (1951) и  "Ю. Сотник. Как я был самостоятельным" и первичное выравнивание в  программе WinMerge коми текстов с русскоязычными эквивалентами для  параллельного корпуса.
  8. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №№ 40, 41, 42), а также изданий "Венгр литератураысь 12 медся мича висьт" (2015) и "Венгр литератураысь 50 медся мича кывбур" (2015); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  9. Загрузка в корпус коми языка вновь обработанных текстов и обновление корпуса.
  10. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-09-03, 1925-09-05, 1925-09-08, 1925-09-10,  1925-09-12 и 1925-09-15; их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  11. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Рӧднӧй сёрни (2-ӧд класслы 1956ʼ вося небӧг)", "Рӧднӧй сёрни (4-ӧд класслы 1961ʼ вося небӧг)", "Том пӧра  коллялӧмӧй! (Е. А. Игушевлӧн 2023' вося небӧг)", "Овтӧм ді вылын (Т.И.  Гончаренко, 1962ʼ вося небӧг)", "Кыдзи ме олі ас кежын (Ю. Сотник, 1961ʼ  вося небӧг)", "Карпатскӧй бипур дорын (А. Авдеенко, 1962ʼ вося небӧг)", "Мый тӧда – сійӧс и висьтала (2014ʼ вося небӧг)".
  12. Озвучивание объявлений автоинформатора и  названий автобусных остановок г. Печора на коми и русском языках по заказу администрации муниципального района "Печора", редактирование аудиозаписи в программе Sound Forge и создание аудиофайлов с названиями отдельных остановок и объявлений.
  13.  Создание вепсской раскладки клавиатуры.
  14. Пополнение сервиса сортировки списков по алфавиту материалами башкирского,  бурятского, ненецкого, тувинского, хакасского и чувашского языков.
  15.  Подключение озвучки для коми-русского словаря к сайту "Онлайн-словари FU-Lab".
  16. Размещение сокращенной версии коми-пермяцко-русского словаря на сайте "Коми лингвистика".
  17. Создание бета-версии коми-пермяцкого спеллера на основе hunspell.
  18. Добавление коми-пермяцкого языка в онлайн-сервис проверки правописания.
  19. Создание расширения для проверки коми-пермяцкой орфографии в браузере FireFox.
  20. Реконструкция удмуртского спелл-чекера: устранены отдельные индексы причастий и деепричастий, материал распределен между глагольными формами и отглагольными прилагательными и наречиями, выявлены дополнительные парадигмы спряжения, добавлены парадигмы аббревиатур, перестроена индексация.
  21. Пополнение словарных баз коми, коми-пермяцкого и удмуртского спелл-чеккеров hunspell новой лексикой, выявленной в обрабатываемых текстах.
  22. Распространение комиязычного контента в соц. сетях.
  23. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  24. Изучение языка программирования Python.
  25. Выступление на мероприятии IV Круглый стол «Сохранение родных языков в условиях глобализации», проведенном Полномочным представительством Республики Татарстан в Российской Федерации 20 октября 2023 года в Татарском культурном центре г. Москва.
FU-Lab. 2023.10.16.-2023.10.20.

опубликовал Öньö Лав в 20:01 19.10.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.10.16.-2023.10.20.
 

  1.  
  2. Выборочный перевод русскоязычных новостных текстов информационного агентства "Интерфакс" и издания "Коммерсант" на коми язык для параллельного корпуса на коми и русском языках.
  3. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №№ 42) и обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Сканирование в программе ABBYY FineReader переводных книжных изданий Т. Гончаренко "Овтӧм ді вылын" (1962), Ю. Сотника "Кыдзи ме олі ас кежын" (1961) на коми языке и создание их электронных копий в формате pdf (104 с.);
  5. Распознавание и вычитка в программе ABBYY FineReader текстов книг Т. Гончаренко "Овтӧм ді вылын" (1962), Ю. Сотника "Кыдзи ме олі ас кежын" (1961) на коми языке (18300 слов), проверка орфографии, обработка распознанного текста в программе LibreOffice Writer.
  6. Разбивка текстов книги Ю. Сотника "Кыдзи ме олі ас кежын" (1951) ("Как я был самостоятельным" на коми и русском языках на строки и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса (1230 строк);
  7. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжному изданию на коми языке: "Мый тӧда – сійӧс и висьтала (2014ʼ вося небӧг)";
  8. Редактирование словника коми-русского словаря для параллельного корпуса.
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-09-12 и 1925-09-15 , их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  10. Реконструкция удмуртского спелл-чекера: добавлены парадигмы аббревиатур, перестроена индексация.
  11. Изучение языка программирования Python.
  12. Пополнение словарных баз коми, коми-пермяцкого и удмуртского спелл-чеккеров hunspell новой лексикой, выявленной в обрабатываемых текстах.
  13. Распространение комиязычного контента в соц. сетях.
  14. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.10.09.-2023.10.13.

опубликовал Öньö Лав в 22:52 12.10.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.10.09.-2023.10.13.
     

  1.  
  2. Выборочный перевод русскоязычных новостных текстов информационного агентства "Интерфакс" и издания "Коммерсант" на коми язык для параллельного корпуса на коми и русском языках.
  3. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №№ 40, 41) и обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Создание метаразметок для текста учебника "Рӧднӧй сёрни:  начальнӧй школаса мӧд класслы лыддьысян книга" (1956) на коми языке.
  5. Сбор русскоязычных текстов оригинала учебника "Родная речь. Книга для чтения во 2 классе" (1954).
  6. Разбивка текстов учебников "Рӧднӧй сёрни: начальнӧй школаса мӧд  класслы лыддьысян книга" (1956) и "Родная речь. Книга для чтения во 2  классе" (1954) на коми и русском языках на строки и первичное выравнивание в  программе WinMerge коми текстов с русскоязычными эквивалентами для  параллельного корпуса.
  7. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін"  отдельных страниц по книжным изданиям на коми языке: "Том пӧра  коллялӧмӧй! (Е. А. Игушевлӧн 2023' вося небӧг)", "Овтӧм ді вылын (Т.И.  Гончаренко, 1962ʼ вося небӧг)", "Кыдзи ме олі ас кежын (Ю. Сотник, 1961ʼ  вося небӧг)", "Карпатскӧй бипур дорын (А. Авдеенко, 1962ʼ вося небӧг)".
  8. Сканирование в программе ABBYY FineReader книги А. Авдеенко  "Карпатскӧй бипур дорын" (1962) на коми языке и создание его электронной  копии в формате pdf.
  9. Распознавание и вычитка в программе ABBYY FineReader текста книги А.  Авдеенко "Карпатскӧй бипур дорын" (1962) на коми языке,  проверка орфографии, обработка распознанного текста в программе LibreOffice  Writer.     
  10. Загрузка в корпус коми языка вновь обработанных текстов и обновление корпуса.
  11. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-09-05, 1925-09-08 и 1925-09-10, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  12. Реконструкция коми-пермяцкого спелл-чекера: расписаны варианты глагольных парадигм, добавлены вариативные формы мн. ч. существительных.
  13. Реконструкция удмуртского спелл-чекера: устранены отдельные индексы причастий и деепричастий, материал распределен между глагольными формами и отглагательными прилагательными и наречиями, выявлены дополнительные парадигмы спряжения.
  14. Изучение языка программирования Python.
  15. Пополнение словарных баз коми, коми-пермяцкого и удмуртского спелл-чеккеров hunspell новой лексикой, выявленной в обрабатываемых текстах.
  16. Распространение комиязычного контента в соц. сетях.
  17. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.10.02.-2023.10.06.

опубликовал Öньö Лав в 16:26 05.10.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.10.02.-2023.10.06.

  1.  
  2. Выборочный перевод русскоязычных новостных текстов информационного агентства "Интерфакс" на коми язык для параллельного корпуса на коми и русском языках.
  3. Распознавание и вычитка в программе ABBYY FineReader текстов учебников "Рӧднӧй сёрни: начальнӧй школаса нёльӧд класслы лыддьысян книга" (1961) и "Рӧднӧй сёрни: начальнӧй школаса мӧд класслы лыддьысян книга" (1956) на коми языке, проверка орфографии, обработка распознанного текста в программе LibreOffice Writer;
  4. Создание метаразметок для текста учебника "Рӧднӧй сёрни: начальнӧй школаса нёльӧд класслы лыддьысян книга" (1961) на коми языке.
  5. Загрузка в корпус коми языка вновь обработанных текстов и обновление корпуса.
  6. Размещение сокращенной версии коми-пермяцко-русского словаря на сайте "Коми лингвистика".
  7. Пополнение коми-пермяцкого спелл-чекера лексемами и грамматическими формами, выявленными в текстах поэтических произведений и периодики.
  8. Перезапись отдельных объявлений автоинформатора и  названий автобусных остановок г. Печора на коми и русском языках, редактирование аудиозаписи в программе Sound Forge и создание аудиофайлов с названиями отдельных остановок и объявлений.
  9. Создание вепсской раскладки клавиатуры.
  10. Изучение языка программирования Python.
  11. Пополнение словарных баз коми и удмуртского спелл-чеккеров hunspell новой лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
     
FU-Lab. 2023.09.25.-2023.09.29.

опубликовал Öньö Лав в 22:42 28.09.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.09.25.-2023.09.29
     

  1. Выборочный перевод русскоязычных новостных текстов издания "Коммерсант" и информационного агентства "Интерфакс" на коми язык для параллельного корпуса на коми и русском языках.
  2. Сканирование в программе ABBYY FineReader переводного книжного издания и создание его электронной копии в формате pdf: "Венгр литератураысь 12 медся мича висьт" (2015), "Рӧднӧй сёрни: начальнӧй школаса мӧд класслы лыддьысян книга" (1956), "Рӧднӧй сёрни: начальнӧй школаса нёльӧд класслы лыддьысян книга" (1961) на коми языке (676 стр.).
  3. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-09-03, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  4. Извлечение из pdf файлов текстов изданий "Венгр литератураысь 12 медся мича висьт" (2015) и "Венгр литератураысь 50 медся мича кывбур" (2015), обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) и загрузка в корпус коми языка.
  5. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Рӧднӧй сёрни (2-ӧд класслы 1956ʼ вося небӧг)", "Рӧднӧй сёрни (4-ӧд класслы 1961ʼ вося небӧг)".
  6. Озвучивание объявлений автоинформатора и  названий автобусных остановок г. Печора на коми и русском языках по заказу администрации муниципального района "Печора", редактирование аудиозаписи в программе Sound Forge и создание аудиофайлов с названиями отдельных остановок и объявлений.
  7. Создание бета-версии коми-пермяцкого спеллера.
  8. Изучение языка программирования Python.
  9. Пополнение словарных баз коми и удмуртского спелл-чеккеров hunspell новой лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2023ʼ вося куим кварталысь отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 20:06 20.09.2023

2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:

2.1. Восстановление коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование различных веток переводчика.

2.2. Выборочный перевод  с русского языка на коми язык новостных текстов федеральных средств массовой информации (РБК, Интерфакс, Коммерсант) для параллельного корпуса ru-kv.

2.3. Сборка и выравнивание текстов новостной ленты официального портала РК на коми и русском языках за сентябрь 2022 г. - январь 2023 г.

2.4. Перевод с русского языка на коми язык стабильных текстов официальных сайтов администрации и совета МОГО "Сыктывкар" и     выравнивание коми и русских эквивалентов по предложениям в программе WinMerge.

2.5. Перевод на русский язык текста учебников коми языка для русскоязычных (1-4 классы), а также  физико-географической части учебного пособия "География Коми АССР" и выравнивание коми и русских эквивалентов в программе WinMerge для включения в базу параллельных текстов на коми и русском языках.

2.6. Распознавание в программе ABBYY FineReader  и перевод на русский язык коми текста учебников "Коми язык. 5 класс" (части 1 и 2, 2017 г.) и "Коми язык. 6 класс" (2018), обработка текстов (разбивка по предложениям, сортировка, устранение повторов) в программе LibreOffice Writer, выравнивание коми и русских эквивалентов в программе WinMerge и включения в базу параллельных текстов на коми и русском языках.

2.7. Возобновление перевода интерфейса MediaWiki с помощью инструмента перевода translate.wiki.

2.8. Возобновление работы по локализации на коми язык социальной сети ВКонтакте: перевод основных элементов раздела "Звонки" и новых актуальных элементов интерфейса в других разделах.

2.9. Локализация интерфейса desktop приложения менеджера Telegram на коми язык и начало локализации iOs и Android приложений менеджера Telegram.

2.10. Предварительная работа по локализации интерфейса браузера Mozilla FireFox на коми язык.

2.11. Перевод и редактирование интерфейса финансового раздела калькулятора MATE.    

2.12. Разделение коми и русского новостного массива радио "Коми гор" за 2015 и 2016 гг. Создание общего файла с коми текстом за 2014-2020 гг. и начало его обработки на предмет восстановления коми графики. Вычленение русскоязычного новостного массива  за 2018 г., корректирование русского текста за 2017 год, обработка файла с коми текстом за 2014-2020 гг. на предмет восстановления коми графики и выравнивание коми и русского материала по метаразметкам за эти годы; вычитка и корректирование новостных текстов "Радио Коми гор" за 2017, 2019 и 2020 гг., маркировка повторных сообщений для последующего удаления из общего массива.

2.13. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии) русскоязычного текста учебника "А. С. Барков, А. А. Половинкин. Физическая география" (1937), разбивка на предложения и выравнивание данного текста с коми переводом издания 1939 года, с восполнением лакун по изданию 1936 года; аналогичная работа произведена с учебными текстами "Л. Г. Терехова, В. Г. Эрдели. География : учебник для четвертого класса начальной школы" (1938/1939), "Н. Баранский. Физическая география СССР. Первая часть" (1935/1939), "С. Ф. Чефранов. Физическая география СССР. Районный обзор" (1937/1941) и "А. Л. Колесников. Из чего состоит вселенная" (1953).

2.14.  Первичное выравнивание в программе WinMerge коми текстов переводных изданий с русскоязычными эквивалентами: "М. Горький. Рассказъяс" (1954), "Н. Дубов. Сирӧта" (1957), "С. Григрьев. Суворов" (1953), "Э. Гофман. Щелкунчик да шыръяслӧн король" (1940),  "Р. С. Торбан. Лым морт" (1959), "Б. Изюмский. Алӧй погонъяс" (1955), "Л. Н. Толстой. Казакъяс" (1956), "Эм. Казакевич. Одер вылын тулыс" (1952), "Антуан де Сент-Экзюпери. Ичӧтик принц" (2021), "Е. Пермяк. Вӧсни струна" (1959), "Р. Фраерман. Майскӧй войӧ подвиг" (1948), Р. Фраерман "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959), "Б. Изюмский. Алӧй погонъяс. Зрелость" (1956), "Изюмскӧй Б. В.  Алӧй погонъяс. Ч. 3 : Дружба ёнмӧ водзӧ" (1957), М. Горький "Америка йылысь" (1954), "А. Рыбаков. Кортик" (1954), "М. Водопьянов. Полярнӧй лётчик" (1958), "В.  Ардаматский. Ме 11-17" (1963), "М. Белахова. Зэв дона груз" (1954), "А. Гайдар. Нёльӧд блиндаж" (1950), "С. Бабаевский. Зӧлӧтӧй звездаа кавалер. Мӧд книга" (1950), "С. Бабаевский. Му весьтын свет" (1951), "С. Григорьев. Малахов курган" (1952), А. Гайдар "Лым крепостьса комендант" (1954), "Александр Бек. Волоколамскӧй шоссе" (1948), "Иван Кожедуб. Служита Рӧдиналы" (1957), "А. Пунченок. Испытание" (1953), "Ю. Збанацкий. Соколинӧй яглӧн тайна" (1956), "О.Коряков. Повтӧмъяслӧн трӧпаӧд" (1956).

2.15. Обновление парсера разбивки на предложения с уточнением возможных контекстуальных исключений для русского и коми языков, и добавлением правил разбивки для удмуртского языка.

2.16. Создание коми локали для операционной системы Simply Linux.

2.17. Добавление в параллельный русско-коми корпус выравненных текстов, обработанных за отчетный период.

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Сканирование в программе ABBYY FineReader переводных книжных изданий на коми языке и создание их электронных копий в формате pdf: "Э. Казакевич. Одер вылын тулыс" (1952), "Л. Н. Толстой. Казакъяс" (1955), "Е. Пермяк. Вӧсни струна" (1959), "Р. Торбан. Лым морт" (1959), "Р. Фраерман. Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959), "Р. Фраерман. Майскӧй войӧ подвиг" (1948), "А. Гончар. Знаменосецъяс" (1955), , Б. Изюмский "Алӧй погонъяс" (1955), Б. Изюмский "Алӧй погонъяс" (1956), А. Сент-Экзюпери "Ичӧтик принц" (2021), Го Можо "Рассказъяс" (1954), С. Крушинский "Алтайскӧй нянь" (1948), А. Бек "Волоколамскӧй шоссе" (1948), А. Новиков-Прибой "Цусима: мӧд часть" (1948), М. Горький "Америка йылысь" (1954), Л. Жариков "Суровӧй друг йылысь повесть" (1953), Е. Юнга "Бессмертнӧй корабль" (1953), "Н. Островский. Бушколын чужысьяс" (1957), "В. Каверин. Мужестволӧн школа" (1957), "И. Кожедуб. Служита Рӧдиналы" (1957), "М. Водопьянов.  Полярнӧй лётчик" (1958), "В. Ардаматский. Ме 11-17" (1963), "А. Пунченок. Испытание (1953), "П. Журба. Александр Матросов" (1953), "В. Овечкин. Передньӧй крайын" (1954), "А. Мусатов. Гӧра йылын керка" (1955), А. Гайдар "Нёльӧд блиндаж" (1950), А. Гайдар "Лым крепостьса комендант" (1954), М. Белахова "Зэв дона груз" (1954), С. Григорьев "Малахов курган" (1952), Ю. Збанацкий "Соколинӧй яглӧн тайна" (1956), "О.Коряков. Повтӧмъяслӧн трӧпаӧд" (1956).

3.2. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка  текстов переводных изданий"М. Горький. Рассказъяс" (1954), "Н. Дубов. Сирӧта" (1957), "С. Григрьев. Суворов" (1953), "Э. Гофман. Щелкунчик да шыръяслӧн король" (1940), "Р. Фраерман. Майскӧй войӧ подвиг" (1948),   "Б. Изюмский. Алӧй погонъяс" (1955), "С. Бабаевский. Зӧлӧтӧй звездаа кавалер" (1950), "Л. Н. Толстой. Казакъяс" (1956), "Р. С. Торбан. Лым морт" (1959), "Антуан де Сент-Экзюпери. Ичӧтик принц" (2021), "Эм. Казакевич. Одер вылын тулыс" (1952), Р. Фраерман "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959), "Е. Пермяк. Вӧсни струна" (1959), "Б. Изюмский. Алӧй погонъяс. Зрелость" (1956), "Изюмскӧй Б. В.  Алӧй погонъяс. Ч. 3 : Дружба ёнмӧ водзӧ" (1957), "Го Можо. Рассказъяс" (1954), "С. Крушинский. Алтайский хлеб" (1984), "М. Горький. Америка йылысь" (1954), "А. Рыбаков. Кортик" (1954), "М. Белахова. Зэв дона груз" (1954), "А. Гайдар. Нёльӧд блиндаж" (1950),  "А. Гайдар. Лым крепостьса командир" (1954), "А. Мусатов. Гӧра йылын керка" (1955), "С. Григорьев. Малахов курган" (1952),  "В. Ардаматский. Ме 11-17" (1963) и "М. Водопьянов. Полярнӧй лётчик" (1958), "Александр Бек. Волоколамскӧй шоссе" (1948), "Иван Кожедуб. Служита Рӧдиналы" (1957), "В. Каверин. Мужестволӧн школа" (1957), "А. Пунченок. Испытание" (1953), "Ю. Збанацкий. Соколинӧй яглӧн тайна"  (1956), "О.Коряков. Повтӧмъяслӧн трӧпаӧд" (1956).

3.3. Сканирование в программе ABBYY FineReader недостающих страниц переводных книжных изданий на коми языке и дополнение их электронных копий в формате pdf: "Л. Кассиль. Менам дона детинкаяс" (1948), М. Жестева "Ичӧтик трактористлӧн приключениеяс" (1953), И. Василенко "Звёздочка" (1950), произведены рспознавание и вычитка данных страниц в программе ABBYY FineReader, проверка орфографии, обработка распознанного текста в программе LibreOffice Writer.

3.4. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2022. №52;  2023. №1-36), журналов "Йӧлӧга" (2022. №№10, 11, 12, 2023. №1-8) и  "Войвыв кодзув" (2022. №№8-12, 2023. №1-3); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).

3.5. Корректирование новостных текстов радио "Коми гор" за 2020 год. Удаление повторов из новостных текстов радио "Коми гор" за 2019-2020 год и разделеление собственно новостей и радиорепортажей по разным файлам.

3.6. Распределение текстов переводных книжных изданий по четырем хронологически маркированным файлам в связи с критическим увеличением объёма общего файла.

3.7. Добавление в корпус коми языка текстов, обработанных за отчетный период.

4. Текстовое пополнение молодцовского и латинского корпусов:

4.1. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов 51 номера газеты "Југыԁ туј" за (1925-02-14,  1925-02-17, 1925-02-19, 1925-02-21, 1925-02-24, 1925-02-27, 1925-03-03, 1925-03-05, 1925-03-07, 1925-03-10, 1925-03-12, 1925-03-21, 1925-03-27, 1925-03-31, 1925-04-02 и 1925-04-04, 1925-04-07, 1925-04-09, 1925-04-11, 1925-04-12, 1925-04-14, 1925-04-17 (приложение "Коми сикт"), 1925-04-21, 1925-04-23, 1925-04-24, 1925-04-25 (приложение "Коми сикт"), 1925-04-28, 1925-05-01 (приложение "Коми сикт"), 1925-05-03, 1925-05-07), 1925-05-09 (приложение "Комі ԍікт"), 1925-05-12, 1925-05-14, 1925-05-16 (приложение "Комі ԍікт"), 1925-05-21, 1925-05-23, 1925-05-27,  1925-05-30,  1925-06-02,  1925-06-04, 1925-06-06 (приложение "Комі ԍікт"),  1925-06-11, 1925-06-13, 1925-06-16, 1925-06-18, 1925-06-20,  1925-06-23, 1925-06-25, 1925-06-27, 1925-06-30, 1925-07-04 (приложение "Комі ԍікт"), 1925-07-07, 1925-07-09, 1925-07-11 (приложение "Комі ԍікт"), 1925-07-14, 1925-07-16, 1925-07-18 (приложение "Комі ԍікт"), 1925-07-21, 1925-07-23, 1925-07-25 (приложение "Комі ԍікт"), 1925-07-30, 1925-08-01, 1925-08-04, 1925-08-06, 1925-08-08 (приложение "Комі ԍікт"), 1923-08-11, 1925-08-13, 1925-08-15 (приложение "Комі ԍікт"), 1925-08-18, 1925-08-20, 1925-08-22 (приложение "Комі ԍікт"), 1925-08-25, 1925-08-27, 1925-08-29 (приложение "Комі ԍікт") и 1925-09-01, их обработка в программе LibreOffice Writer и включение в молодцовский корпус.

4.2. Распознавание и вычитка в программе АВВYY FineReader молодцовских текстов изданий "100 комі ԍыланкыв" (1935), "Грімм вокјаслӧн мојԁјас" (1938), "Ԁ. Грігорович. Гуттаперчевӧј ԃеԏінка" (1938),  "Н. С. Шер. Ајна" (1936) для молодцовского корпуса.

4.3. Распознавание и вычитка в программе АВВYY FineReader и обработка в программе LibreOffice Writer латинских текстов учебников "A. Ꞑ. Kaвanov. Mortlən anatomija da fiⱬiologija" (1934) и "Ꞑ. Rьвkin. Geometrijaьş zadaçajas sborņik" (1934).

5. Пополнение онлайн библиотеки "Коми гижӧд":

5.1. Заключение лицензионных договоров с правообладателями текстов авторов Раевский Степан Семенович, Касеева Клавдия Андреевна, Габов Прокопий Валентинович, Одинцов Алексей Серафимович, вычитка, корректировка и размещение в коми онлайн библиотеке «Коми гижӧд» текстов произведений данных авторов.

5.2. Размещение в коми онлайн библиотеке «Коми гижӧд» новых текстов произведений автора Карманова Ксения Ивановна.

5.3. Размещение в коми онлайн библиотеке «Коми гижӧд» аудиоматериала к текстам произведений Г. И. Попова.

5.4. Размещение в онлайн библиотеке "Коми гижӧд" коми текстов 73 номеров газеты "Југыԁ туј" в переводе на современную графику.

5.5. Перевод латинского текста учебника "Ꞑ. Rьвkin. Geometrijaьş zadaçajas sborņik" (1934) на современную графику и его размещение в онлайн библиотеке "Коми гижӧд".

6. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

6.1. Создание авторской wiki-страницы и библиографии текстов авторов Габов П. В., Касеева К. А. и Анна Кучева, размещение ссылок на произведения, размещенные в библиотеке "Коми гижӧд".

6.2. Пополнение библиографии текстов автора Карманова К. И. на wiki-странице автора, добавление ссылок на новые произведения, размещенные в библиотеке "Коми гижӧд".

6.3. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по переводчикам и переводным изданиям: "Елькина Нина Андреевна", "Шадрин Фёдор Вонифатьевич", "Фантазёръяс (Н. Носов, 1959ʼ вося небӧг)",  "Вӧсни струна (Е. Пермяк, 1959ʼ вося небӧг)", "Казакъяс (Л. Н. Толстой, 1956ʼ вося небӧг)", "Одер вылын тулыс (Э. Казакевич, 1952ʼ вося небӧг)",  "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть (Р. И. Фраерман, 1957ʼ вося небӧг)", "Майскӧй войӧ подвиг (Р. Фраерман, 1948ʼ вося небӧг)", "Лым морт (Р. С. Торбан, 1959ʼ вося небӧг)", "Дзоля принс (А. Сент-Экзюпери, 2022' вося небӧг)", "Аля-каля (А. Шомысовалӧн 2022' вося небӧг)", "Америка йылысь (М. Горькӧй, 1954ʼ вося небӧг)", "Бессмертнӧй корабль (Е. Юнга, 1953ʼ вося небӧг)", "Суровӧй друг йылысь повесть (Л. Жариков, 1953ʼ вося небӧг)", "Кортик (А. Н. Рыбаков, 1954ʼ вося небӧг)", "Алӧй погонъяс (Б. Изюмскӧй, 1955ʼ вося небӧг)", "Алӧй погонъяс. Зрелость (Б. Изюмскӧй, 1956ʼ вося небӧг)", "Алӧй погонъяс. Дружба ёнмӧ водзӧ (Б. Изюмскӧй, 1957ʼ вося небӧг)" , А. Гончар. Знаменосецъяс" (1955), "Рассказъяс (Го Можо, 1954ʼ вося небӧг)", "Алтайскӧй нянь (С. Крушинскӧй, 1948ʼ вося небӧг)", "Волоколамскӧй шоссе (А. Бек, 1948ʼ вося небӧг)", "Цусима (А. С. Новиков-Прибой, 1948ʼ вося небӧг)", "Испытание (А. Пунченок, 1953ʼ вося небӧг)", "Александр Матросов (П.Г. Журба, 1953ʼ вося небӧг)", "Передньӧй крайын (В. В. Овечкин, 1954ʼ вося небӧг)", "Гӧра йылын керка (А. Мусатов, 1955ʼ вося небӧг)", "Нёльӧд блиндаж (А. Гайдар, 1950ʼ вося небӧг)", "Лым крепостьса комендант (А. Гайдар, 1954ʼ вося небӧг)", "Зэв дона груз (М. А. Белахова, 1954ʼ вося небӧг)", "Малахов курган (С. Григорьев, 1952ʼ вося небӧг)",  "Мойдъяс (М. Е.  Салтыков-Щедрин, 1955ʼ вося небӧг)", "Полярнӧй лётчик (М. Водопьянов,  1958ʼ вося небӧг)", "Ме 11-17 (В. Ардаматскӧй, 1963ʼ вося небӧг)", "Служита Рӧдиналы (И. Кожедуб, 1957ʼ вося небӧг)", "Бушковын чужысьяс (Н. Островскӧй , 1957ʼ вося небӧг)", "Мужестволӧн школа (В. Каверин, 1957ʼ вося небӧг)",  "Енэжӧ содъяс (Надежда Павловалӧн 2016ʼ вося небӧг)", "Сьӧд вӧр шӧрын (А. Кучевалӧн 2023ʼ вося небӧг)", "Лемванырд (С. Терентьевлӧн 2008ʼ вося небӧг)", "Тӧвся войӧ (С. Терентьевлӧн 2022' вося небӧг)", "Пыж да лов (Е.  Афанасьевалӧн 2023ʼ вося небӧг)", "Лампа пӧч да Шурш (Л. Ануфриевалӧн 2023ʼ вося небӧг)", "Мӧд шонді (Л. Ануфриевалӧн 2022ʼ вося небӧг)", "Кумач морӧса жонь (А. Ванеевлӧн 2023ʼ вося небӧг)", "Сипсик — ловъя акань (Е. Цыпановлӧн 2023ʼ вося небӧг)", "Ю. Збанацкий. Соколинӧй яглӧн тайна"  (1956), "Повтӧмъяслӧн тропаӧд (О. Коряков, 1956ʼ вося небӧг)".

6.4. Создание и заполнение wiki-страниц с оглавлением по 73 номерам газеты "Југыԁ туј" за 1925 год в онлайн-справочнике "Коми тӧданін".

6.5. Создание перечня коми поэм и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по данному жанру.

6.6. Пополнение таблицы по комиязычным изданиям книгами за 2022 и 2023 гг.

6.7. Создание ссылок на произведения Степана Семеновича Раевского и Алексея Серафимовича Одинцова, размещенные в коми онлайн библиотеке "Коми гижӧд", со страниц авторов на справочном wiki-ресурсе "Коми тӧданін" .

7. Создание мультиязычного корпуса по пермским языкам:

7.1. Предварительное выравнивание в программе WinMerge первоначального текстового материала для мультиязычного параллельного корпуса на русском и пермских языках.

7.2. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии) удмуртских переводов учебников: "М. И. Ильин. Палʼёсыз тодон" (1924), "Географи. Одӥг ёзо школаысь куинетӥ арын дышетоно книга" (1933), "География. Нырысетӥ люкетэз. Начальной школалэн куиньметӥ классэзлы учебник" (1940), "А. С. Барков но А. А. Половинкин. Физической география. Неполной средней но средней школалэн 5-тӥ классэзлы учебник" (1940), "Л. Г. Терехова но В. Г. Эрдели. Географи. Одӥг ёзо школаысь ньылетӥ арын дышетоно книга" (1933), "М. Потемкин но П. Терехов. Географи : ӧжыт гожтэт тодӥсьёслы дышетскон книга " (1934), "И. Г. Иванов. География. Дунне люкетъёс но важнейшой странаос (СССР-тэк)" (1941), "В. А. Тетюрев. Естествознание. 1 люкетэз" (1939), "Н. Н. Баранский. СССР-лэн физической географиез" (1940), "С. В. Чефранов. СССР-лэн физической географиез. Районной обзор" (1941), "В. А. Тетюрев. Естествознание. 2 люкетэз : начальной школалы 4 кл. учебник " (1941), "Л. Г. Терехова, В. Г. Эрдели.  География. 2-тӥ люкетэз: начальной школалы ньылетӥ класслы. 7-тӥ изд." (1940), "М. П. Потёмкин но П. Г. Терехов. География. Взрослойёслӧн школаоссылы учебник" (1939), "Б. В. Всесвятский. Ботаника" (1933) и  "М. Я. Цузмер. Зоология" (1933) для корпуса удмуртского языка и мультиязычного корпуса.

7.3. Распознавание и вычитка в программе АВВYY FineReader удмуртского текста учебника "Н. Н. Баранский. СССР географи" (1933) для корпуса удмуртского языка и параллельных корпусов.

7.4. Сверка модернизированных текстов учебников "Б. В. Всесвятский. Ботаника" (1933) и  "М. Я. Цузмер. Зоология" (1933) с текстами на старой орфографии.

8. Помощь коллегам в регионах:

8.1. Распространение опыта лаборатории FU-Lab по сбору и лингвистической предобработке данных среди языковых активистов других национальных регионов Российской Федерации в чате телеграм канала "Языков много — код один".

8.2. Создание справочного вики-ресурса по удмуртской письменности.

8.3. Создание погодовых таблиц по книжным изданиям на удмуртском языке за 1900-1945 гг. для вики-ресурса по удмуртской письменности на основе каталогов РНБ.

8.4. Создание и заполнение на справочном wiki-ресурсе "Удмурт гожъяськет" отдельных страниц по десяти учебникам 1939-41 гг., страницы с современными правилами удмуртского правописания, страницы с полным списком вокабул удмуртского орфографического словаря и страницы с полным списком удмуртских словарей.

8.5. Реконструкция удмуртского вариативного спелл-чеккера hunspell на основе новых подходов к описанию морфологии и пополнение словарной базы удмуртского спеллера лексикой, выявленной в текстах десяти распознанных изданий и лексикой, собранной сотрудниками отдела филологических исследований УИИЯЛ УдмФИЦ УрО РАН для грамматического парсера.

8.6. Проверка индексации именных категорий для коми-пермяцкого спеллера.

9. Пополнение лексической базы FU-Lab:

9.1. Редактирование и размещение материала коми-русского и русско-коми словаря Н. Рогова (1869 г.) на сайте "Коми лингвистика".

10. Пополнение словарной базы средства проверки правописания Hunspell:

10.1. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.

10.2. Внедрение поддержки коми правописания в среду операционной системы Simply Linux.

11. Распространение комиязычного контента в соц. сетях.

12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

13. Иное.

13.1. Выравнивание по предложениям текста произведения А. Сент-Экзюпери "Ичӧтик принц" на французском и русском языках с обоими коми переводами.  

13.2. Подборка текстов всех коми поэм для анталогии текстов данного жанара по просьбе Союза писателей Республики Коми.

13.3. Подборка текстов автора А. А. Лыюров из корпуса коми языка для юбилейной публикации по просьбе Союза писателей РК.

13.4. Подготовка трех текстов автора С. М. Морозов для публикации в журнале "Войвыв кодзув" по просьбе редакции.

13.5. Обратный перевод сказки "Материнский ковер" на коми-пермяцкий язык по просьбе сектора фольклора ИЯЛИ КНЦ УрО РАН.

13.6. Устранение технических неполадок на сервере FU-Lab.

13.7. Изучение языка программирования Python.

14. Участие в мероприятиях:  

14.1. Участие в мероприятии "Ӧтувъя коми диктант".  

14.2. Участие в социолигвистическом онлайн коллоквиуме МАФУН, посвященном языковому планированию в отношении финно-угорских языков России в первой половине XX века (2023.05.10).

14.3. Выступление на ІІ Всероссийском форуме финно-угорских народов "Этнокультурное многообразие России: современные вызовы и перспективы развития" в Саранске на тему "Создание параллельного корпуса и датасета для русско-коми машинного переводчика". 2023-08-17.

2023ʼ вося коймӧд квартался отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 19:11 20.09.2023

2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:

2.1. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye.

2.2. Продолжение выборочного перевода с русского языка на коми язык новостных текстов федеральных средств массовой информации (РБК, Интерфакс, Коммерсант) для параллельного корпуса ru-kv.

2.3. Распознавание и вычитка в программе ABBYY FineReader русскоязычных учебных текстов "Н. Баранский. Физическая география СССР. Первая часть" (1935), "С. Ф. Чефранов. Физическая география СССР. Районный обзор" (1937) и "А. Л. Колесников. Из чего состоит вселенная" (1953)  для дальнейшей параллелизации с коми переводами, проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer.

2.4. Первичное выравнивание в программе WinMerge коми текста с русскоязычным эквивалентом для параллельного корпуса по изданию: "Баранский Н. Н. СССР-лӧн физическӧй география" (1939), "Чефранов С. В. СССР-лӧн физическӧй география. Вып. 2" (1941), "С. Григорьев. Малахов курган" (1952), А. Гайдар "Лым крепостьса комендант" (1954), "Александр Бек. Волоколамскӧй шоссе" (1948), "Иван Кожедуб. Служита Рӧдиналы" (1957), "А. Пунченок. Испытание" (1953), "Ю. Збанацкий. Соколинӧй яглӧн тайна"  (1956), "О.Коряков. Повтӧмъяслӧн трӧпаӧд" (1956).

2.5. Добавление в параллельный русско-коми корпус выравненных текстов, обработанных за отчетный период.

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Сканирование в программе ABBYY FineReader переводных книжных изданий на коми языке и создание их электронних копий в формате pdf: Ю. Збанацкий "Соколинӧй яглӧн тайна" (1956), "О.Коряков. Повтӧмъяслӧн трӧпаӧд" (1956).

3.2. Распознавание и вычитка в программе ABBYY FineReader коми текстов изданий "Александр Бек. Волоколамскӧй шоссе" (1948), "Иван Кожедуб. Служита Рӧдиналы" (1957), "В. Каверин. Мужестволӧн школа" (1957), "А. Пунченок. Испытание" (1953), "Ю. Збанацкий. Соколинӧй яглӧн тайна"  (1956), "О.Коряков. Повтӧмъяслӧн трӧпаӧд" (1956), проверка орфографии, обработка распознанного текста в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).

3.3. Сканирование в программе ABBYY FineReader недостающих страниц переводных книжных изданий на коми языке и дополнение их электронных копий в формате pdf: "Л. Кассиль. Менам дона детинкаяс" (1948), М. Жестева "Ичӧтик трактористлӧн приключениеяс" (1953), И. Василенко "Звёздочка" (1950), произведены рспознавание и вычитка данных страниц в программе ABBYY FineReader, проверка орфографии, обработка распознанного текста в программе LibreOffice Writer и корректирование для параллельного корпуса.

3.4. Корректирование новостных текстов радио "Коми гор" за 2020 год. Удаление повторов из новостных текстов радио "Коми гор" за 2019-2020 год и разделеление собственно новостей и радиорепортажей по разным файлам.

3.5. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №25-36) и журнала "Йӧлӧга" (2023. №№5-8) и  "Войвыв кодзув" (2022. №№8-12, 2023. №1-3); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).

3.6. Распределение текстов переводных книжных изданий по четырем хронологически маркированным файлам в связи с критическим увеличением объёма общего файла.

3.7. Добавление в корпус коми языка текстов, обработанных за отчетный период.

4. Текстовое пополнение молодцовского и латинского корпуса:

4.1. Распознавание и вычитка в программе АВВYY FineReader молодцовских текстов изданий "100 комі ԍыланкыв" (1935), "Грімм вокјаслӧн мојԁјас" (1938),  "Ԁ. Грігорович. Гуттаперчевӧј ԃеԏінка" (1938),  "Н. С. Шер. Ајна" (1936) для молодцовского корпуса.

4.2. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-07-07, 1925-07-09, 1925-07-11 (приложение "Комі ԍікт"), 1925-07-14, 1925-07-16, 1925-07-18 (приложение "Комі ԍікт"), 1925-07-21, 1925-07-23, 1925-07-25 (приложение "Комі ԍікт"), 1925-07-30, 1925-08-01, 1925-08-04, 1925-08-06, 1925-08-08 (приложение "Комі ԍікт"), 1923-08-11, 1925-08-13, 1925-08-15 (приложение "Комі ԍікт"), 1925-08-18, 1925-08-20, 1925-08-22 (приложение "Комі ԍікт"), 1925-08-25, 1925-08-27, 1925-08-29 (приложение "Комі ԍікт") и 1925-09-01, их обработка в программе LibreOffice Writer и включение в молодцовский корпус.

4.3. Распознавание и вычитка в программе АВВYY FineReader и обработка в программе LibreOffice Writer латинских текстов учебников "A. Ꞑ. Kaвanov. Mortlən anatomija da fiⱬiologija" (1934) и "Ꞑ. Rьвkin. Geometrijaьş zadaçajas sborņik" (1934).

5. Пополнение онлайн библиотеки "Коми гижӧд":

5.1. Вычитка и размещение в коми онлайн библиотеке «Коми гижӧд» текстов произведений автора Одинцов Алексей Серафимович.

5.2. Перевод латинского текста учебника "Ꞑ. Rьвkin. Geometrijaьş zadaçajas sborņik" (1934) на современную графику и его размещение в онлайн библиотеке "Коми гижӧд".

5.3. Размещение в онлайн библиотеке "Коми гижӧд" коми текстов 24 номеров газеты "Југыԁ туј" за 1925 год в переводе на современную графику.

6. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

6.1. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Лемванырд (С. Терентьевлӧн 2008ʼ вося небӧг)", "Тӧвся войӧ (С. Терентьевлӧн 2022' вося небӧг)", "Пыж да лов (Е.  Афанасьевалӧн 2023ʼ вося небӧг)", "Лампа пӧч да Шурш (Л. Ануфриевалӧн 2023ʼ вося небӧг)", "Мӧд шонді (Л. Ануфриевалӧн 2022ʼ вося небӧг)", "Кумач морӧса жонь (А. Ванеевлӧн 2023ʼ вося небӧг)", "Сипсик — ловъя акань (Е. Цыпановлӧн 2023ʼ вося небӧг)", "Ю. Збанацкий. Соколинӧй яглӧн тайна"  (1956), "Повтӧмъяслӧн тропаӧд (О. Коряков, 1956ʼ вося небӧг)".

6.2. Создание и заполнение wiki-страниц с оглавлением по 24 номерам  газеты "Југыԁ туј" за 1925 год в онлайн-справочнике "Коми тӧданін".

6.3. Создание ссылок на произведения Степана Семеновича Раевского и Алексея Серафимовича Одинцова, размещенные в коми онлайн библиотеке "Коми гижӧд", со страниц авторов на справочном wiki-ресурсе "Коми тӧданін" .

7. Создание мультиязычного корпуса по пермским языкам:

7.1. Распознавание и вычитка в программе АВВYY FineReader удмуртского текста учебника "Н. Н. Баранский. СССР географи" (1933) для корпуса удмуртского языка и параллельных корпусов.

7.2. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии) удмуртских переводов учебников: "В. А. Тетюрев. Естествознание. 2 люкетэз : начальной школалы 4 кл. учебник " (1941), "Л. Г. Терехова, В. Г. Эрдели.  География. 2-тӥ люкетэз: начальной школалы ньылетӥ класслы. 7-тӥ изд." (1940), "М. П. Потёмкин но П. Г. Терехов. География. Взрослойёслӧн школаоссылы учебник" (1939), "Б. В. Всесвятский. Ботаника" (1933) и  "М. Я. Цузмер. Зоология" (1933) для корпуса удмуртского языка и параллельных корпусов.   

7.3. Сверка модернизированных текстов учебников "Б. В. Всесвятский. Ботаника" (1933) и  "М. Я. Цузмер. Зоология" (1933) с текстами на старой орфографии.

8. Помощь коллегам в регионах:

8.1. Создание и заполнение на справочном wiki-ресурсе "Удмурт гожъяськет" отдельных страниц по десяти учебникам 1939-41 гг., страницы с современными правилами удмуртского правописания, страницы с полным списком вокабул удмуртского орфографического словаря и страницы с полным списком удмуртских словарей.

8.2. Реконструкция удмуртского вариативного спелл-чеккера hunspell на основе новых подходов к описанию морфологии и пополнение словарной базы удмуртского спеллера лексикой, выявленной в текстах десяти распознанных изданий и лексикой, собранной сотрудниками отдела филологических исследований УИИЯЛ УдмФИЦ УрО РАН для грамматического парсера.

8.3. Проверка индексации именных категорий для коми-пермяцкого спеллера.

9. Пополнение словарной базы средства проверки правописания Hunspell:

9.1. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.

9.2. Внедрение поддержки коми правописания в среду операционной системы Simply Linux.

10. Распространение комиязычного контента в соц. сетях.

11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

12. Иное

12.1. Подборка текстов автора А. А. Лыюров из корпуса коми языка для юбилейной публикации по просьбе Союза писателей РК.

12.2. Подготовка трех текстов автора С. М. Морозов для публикации в журнале "Войвыв кодзув" по просьбе редакции.

12.3. Обратный перевод сказки "Материнский ковер" на коми-пермяцкий язык по просьбе сектора фольклора ИЯЛИ КНЦ УрО РАН.

12.4. Устранение технических неполадок на сервере FU-Lab.

12.5. Изучение языка программирования Python.

13. Участие в мероприятиях:

12.1. Выступление на ІІ Всероссийском форуме финно-угорских народов "Этнокультурное многообразие России: современные вызовы и перспективы развития" в Саранске на тему "Создание параллельного корпуса и датасета для русско-коми машинного переводчика". 2023-08-17.

2023ʼ кӧч тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 18:02 20.09.2023

28.08.2023–24.09.2023.

  1. Выборочный перевод новостных текстов информационного агенства «Интерфакс» и издания "Коммерсант" с русского языка на коми язык для параллельного корпуса на коми и русском языках.
  2. Вычитка и размещение в коми онлайн библиотеке «Коми гижӧд» текстов произведений автора Одинцов Алексей Серафимович.
  3. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №№ 33, 34, 35, 36) и журналов "Йӧлӧга" (2023. №8) и  "Войвыв кодзув" (2023 №№ 2,3) и обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Сканирование в программе ABBYY FineReader недостающих страниц переводных книжных изданий на коми языке и дополнение их электронных копий в формате pdf: М. Жестева "Ичӧтик трактористлӧн приключениеяс" (1953), И. Василенко "Звёздочка" (1950), произведены рспознавание и вычитка данных страниц в программе ABBYY FineReader, проверка орфографии, обработка распознанного текста в программе LibreOffice Writer и корректирование для параллельного корпуса.
  5. Сканирование в программе ABBYY FineReader переводных книжных изданий на коми языке и создание их электронних копий в формате pdf: Ю. Збанацкий "Соколинӧй яглӧн тайна" (1956), "О.Коряков. Повтӧмъяслӧн трӧпаӧд" (1956).
  6. Распознавание и вычитка в программе ABBYY FineReader текстов изданий "А. Пунченок. Испытание" (1953), "Ю. Збанацкий. Соколинӧй яглӧн тайна"  (1956), "О.Коряков. Повтӧмъяслӧн трӧпаӧд" (1956) на коми языке, проверка орфографии, обработка распознанного текста в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.
  7. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Ю. Збанацкий. Соколинӧй яглӧн тайна"  (1956), "Повтӧмъяслӧн тропаӧд (О. Коряков, 1956ʼ вося небӧг)".
  8. Создание ссылок на произведения Степана Семеновича Раевского и Алексея Серафимовича Одинцова, размещенные в коми онлайн библиотеке "Коми гижӧд", со страниц авторов на справочном wiki-ресурсе "Коми тӧданін" .
  9. Пополнение корпуса коми языка и параллельного корпуса текстами, подготовленными за последний месяц.
  10. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-08-15 (приложение "Комі ԍікт"), 1925-08-18, 1925-08-20, 1925-08-22 (приложение "Комі ԍікт"), 1925-08-25, 1925-08-27, 1925-08-29 (приложение "Комі ԍікт") и 1925-09-01, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  11. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, метаразметка и расстановка языковых тэгов)  удмуртских текстов учебников "Б. В. Всесвятский. Ботаника" (1933) и  "М. Я. Цузмер. Зоология" (1933) для корпуса удмуртского языка и параллельных корпусов, сверка модернизированных текстов данных учебников с текстами на старой орфографии.
  12. Обратный перевод сказки "Материнский ковер" на коми-пермяцкий язык по просьбе сектора фольклора ИЯЛИ КНЦ УрО РАН.
  13. Проверка индексации именных категорий для коми-пермяцкого спеллера.
  14. Изучение языка программирования Python.
  15. Пополнение словарных баз коми и удмуртского спелл-чеккеров hunspell новой лексикой, выявленной в обрабатываемых текстах.
  16. Распространение комиязычного контента в соц. сетях.
  17. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.09.18.-2023.09.22.

опубликовал Öньö Лав в 17:41 20.09.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.09.18.-2023.09.22
 

  1.  
  2. Выборочный перевод новостных текстов издания "Коммерсант" на коми язык для параллельного корпуса на коми и русском языках.
  3. Вычитка и размещение в коми онлайн библиотеке «Коми гижӧд» текстов произведений автора Одинцов Алексей Серафимович, сделанны ссылки на размещенные произведения со страницы автора на wiki-ресурсе "Коми тӧданін".
  4. Сканирование в программе ABBYY FineReader и создание электронной копии в формате pdf, распознавание и вычитка в программе ABBYY FineReader, проверка орфографии, обработка распознанного текста в программе LibreOffice Writer переводного книжного издания "О.Коряков. Повтӧмъяслӧн трӧпаӧд" (1956) на коми языке.
  5. Разбивка на строки текстов книги О.Корякова "Повтӧмъяслӧн трӧпаӧд" ("Тропою смелых") на коми и русском языках и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.
  6. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по книжному изданию на коми языке: "Повтӧмъяслӧн тропаӧд (О. Коряков, 1956ʼ вося небӧг)".
  7. Создание ссылок на произведения Степана Семеновича Раевского, размещенные в коми онлайн библиотеке "Коми гижӧд", со страницы автора на справочном wiki-ресурсе "Коми тӧданін" .
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-09-01, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  9. Извлечение из pdf файлов текстов журнала "Войвыв кодзув" (2023 №№ 2,3) и обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  10. Пополнение корпуса коми языка текстами, подготовленными за последний месяц.
  11. Сверка модернизированных текстов с текстами на старой орфографии удмуртских учебников "Б. В. Всесвятский. Ботаника" (1933) и  "М. Я. Цузмер. Зоология" (1933) для корпуса удмуртского языка и параллельных корпусов.
  12. Проверка индексации именных категорий для коми-пермяцкого спеллера.
  13. Изучение языка программирования Python.
  14. Пополнение словарных баз коми и удмуртского спелл-чеккеров hunspell новой лексикой, выявленной в обрабатываемых текстах.
  15. Распространение комиязычного контента в соц. сетях.
  16. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.09.11.-2023.09.15.

опубликовал Öньö Лав в 23:57 14.09.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.09.11.-2023.09.15

  1.  
  2. Выборочный перевод новостных текстов информационного агенства «Интерфакс» и издания "Коммерсант" на коми язык для параллельного корпуса на коми и русском языках.
  3. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №№ 35, 36); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) и добавление в корпус коми языка.
  4. Распознавание и вычитка в программе ABBYY FineReader текста книги Ю. Збанацкого "Соколинӧй яглӧн тайна" (1956) на коми языке, проверка орфографии, обработка распознанного текста в программе LibreOffice Writer;
  5. Разбивка текста "Ю. Збанацкий. Соколинӧй яглӧн тайна" на коми и русском языках на строки и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-08-27, 1925-08-29 (приложение "Комі ԍікт"), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  7. Обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, метаразметка и расстановка языковых тэгов) удмуртских текстов учебников "Б. В. Всесвятский. Ботаника" (1933) и  "М. Я. Цузмер. Зоология" (1933) для корпуса удмуртского языка и параллельных корпусов.
  8. Изучение языка программирования Python.
  9. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2023.09.04.-2023.09.08.

опубликовал Öньö Лав в 1:40 08.09.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.09.04.-2023.09.08

  1.  
  2. Перевод новостных текстов информационного агенства «Интерфакс» и издания "Коммерсант" на коми язык для параллельного корпуса на коми и русском языках.
  3. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №№ 33, 34) и журнала "Йӧлӧга" (2023. №8); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) и добавление в корпус коми языка.
  4. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-08-15 (приложение "Комі ԍікт"),  1925-08-18, 1925-08-20, 1925-08-22 (приложение "Комі ԍікт") и 1925-08-25, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  5. Сканирование в программе ABBYY FineReader переводного книжного издания и создание его электронной копии в формате pdf: Ю. Збанацкий "Соколинӧй яглӧн тайна" (1956) на коми языке, создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по данному изданию.
  6. Сканирование в программе ABBYY FineReader недостающих страниц переводных книжных изданий на коми языке и дополнение их электронных копий в формате pdf: М. Жестева "Ичӧтик трактористлӧн приключениеяс" (1953), И. Василенко "Звёздочка" (1950), произведены рспознавание и вычитка данных страниц в программе ABBYY FineReader, проверка орфографии, обработка распознанного текста в программе LibreOffice Writer и корректирование для параллельного корпуса.
  7. Распознавание и вычитка в программе ABBYY FineReader текста книги А Пунченка "Испытание" (1953) на коми языке, проверка орфографии, обработка распознанного текста в программе LibreOffice Writer и первичное выравнивание в программе WinMerge данного текста с русскоязычным эквивалентом.
  8. Распознавание и вычитки в программе АВВYY FineReader удмуртских текстов учебников "Б. В. Всесвятский. Ботаника" (1933) и  "М. Я. Цузмер. Зоология" (1933) для корпуса удмуртского языка и параллельных корпусов.
  9. Обратный перевод сказки "Материнский ковер" на коми-пермяцкий язык по просьбе сектора фольклора ИЯЛИ КНЦ УрО РАН.
  10. Начало изучения языка программирования Python.
  11. Распространение комиязычного контента в соц. сетях.
2023ʼ моз тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 11:50 24.08.2023

24.07.2023–25.08.2023.

 

  1.  
  2. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye.
  3. Продолжение выборочного перевода с русского языка на коми язык новостных текстов федеральных средств массовой информации для параллельного корпуса ru-kv.
  4. Распознавание и вычитка в программе АВВYY FineReader молодцовских текстов изданий "100 комі ԍыланкыв" (1935), "Грімм вокјаслӧн мојԁјас" (1938),  "Ԁ. Грігорович. Гуттаперчевӧј ԃеԏінка" (1938),  "Н. С. Шер. Ајна" (1936) для молодцовского корпуса, текста русскоязычного издания "А. Л. Колесников. Из чего состоит вселенная" (1953) для параллельного корпуса и удмуртского текста учебника "Н. Н. Баранский. СССР географи" (1933) для корпуса удмуртского языка и параллельных корпусов.
  5. Распознавание и вычитка в программе АВВYY FineReader и обработка в программе LibreOffice Writer текстов переводных изданий: "Александр Бек. Волоколамскӧй шоссе" (1948), "Иван Кожедуб. Служита Рӧдиналы" (1957),  первичное выравнивание данных текстов в программе WinMerge с русскоязычными эквивалентами для параллельного корпуса.
  6. Первичное выравнивание в программе WinMerge коми текста с русскоязычным эквивалентом для параллельного корпуса по изданию: А. Гайдар "Лым крепостьса комендант" (1954).
  7. Сканирование отсутствовавших страниц книги "Л. Кассиль. Менам дона детинкаяс" (1948) по экземпляру из НБРК, распознавание текста и добавление в корпус коми языка.
  8. Распознавание и вычитка в программе АВВYY FineReader и обработка в программе LibreOffice Writer латинских текстов учебников "A. Ꞑ. Kaвanov. Mortlən anatomija da fiⱬiologija" (1934) и "Ꞑ. Rьвkin. Geometrijaьş zadaçajas sborņik" (1934).
  9. Перевод латинского текста учебника "Ꞑ. Rьвkin. Geometrijaьş zadaçajas sborņik" (1934) на современную графику и размещение в онлайн библиотеке "Коми гижӧд".
  10. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №№ 28-32), журналов "Йӧлӧга" (2023. №№5, 7) и  "Войвыв кодзув" (2022. №№8-12, 2023. №1); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  11. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-07-23, 1925-07-25 (приложение "Комі ԍікт"), 1925-07-30, 1925-08-01, 1925-08-04, 1925-08-06, 1925-08-08 (приложение "Комі ԍікт"), 1923-08-11, 1925-08-13, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  12. Подготовка трех текстов автора С. М. Морозов для публикации в журнале "Войвыв кодзув" по просьбе редакции.
  13. Устранение технических неполадок на сервере FU-Lab.
  14. Пополнение словарной базы коми спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  15. Распространение комиязычного контента в соц. сетях.
  16. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  17. Выступление на ІІ Всероссийском форуме финно-угорских народов "Этнокультурное многообразие России: современные вызовы и перспективы развития" в Саранске на тему "Создание параллельного корпуса и датасета для русско-коми машинного переводчика". 2023-08-17.
FU-Lab. 2023.08.21.-2023.08.25

опубликовал Öньö Лав в 10:38 24.08.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.08.21.-2023.08.25

  1. Перевод новостных текстов информационного агенства «Интерфакс» на коми язык для параллельного корпуса на коми и русском языках.
  2. Распознавание и вычитка в программе АВВYY FineReader и обработка в программе LibreOffice Writer латинских текстов учебников "A. Ꞑ. Kaвanov. Mortlən anatomija da fiⱬiologija" (1934) и "Ꞑ. Rьвkin. Geometrijaьş zadaçajas sborņik" (1934).
  3. Перевод латинского текста учебника "Ꞑ. Rьвkin. Geometrijaьş zadaçajas sborņik" (1934) на современную графику и размещение в онлайн библиотеке "Коми гижӧд".
  4. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-08-13, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  5. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2023.08.14.-2023.08.18

опубликовал Öньö Лав в 14:31 18.08.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.08.14.-2023.08.18

  1.  
  2. Перевод новостных текстов информационного агенства «Интерфакс» на коми язык для параллельного корпуса на коми и русском языках.
  3. Извлечение из pdf файлов текстов газеты "Коми му" (2023. №№31, 32) и журнала "Войвыв кодзув" (2022. №12, 2023. №1); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-08-08 (приложение "Комі ԍікт") и 1923-08-11, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  5. Распознавание и вычитка в программе АВВYY FineReader молодцовских текстов изданий "Грімм вокјаслӧн мојԁјас" (1938),  "Ԁ. Грігорович. Гуттаперчевӧј ԃеԏінка" (1938),  "Н. С. Шер. Ајна" (1936).
  6. Устранение технических неполадок на сервере FU-Lab.
  7. Пополнение словарной базы коми спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  8. Распространение комиязычного контента в соц. сетях.
  9. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  10. Выступление на ІІ Всероссийском форуме финно-угорских народов "Этнокультурное многообразие России: современные вызовы и перспективы развития" в Саранске на тему "Создание параллельного корпуса и датасета для русско-коми машинного переводчика". 2023-08-17.
FU-Lab. 2023.08.07.-2023.08.11

опубликовал Öньö Лав в 19:21 09.08.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.08.07.-2023.08.11

 

  1.  
  2. Перевод новостных текстов информационного агенства «Интерфакс» на коми язык для параллельного корпуса на коми и русском языках. 
  3. Извлечение из pdf файлов текстов журнала "Войвыв кодзув" (2022. №№8-11); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-08-06, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  5. Распознавание и вычитка в программе АВВYY FineReader молодцовского текста издания "100 комі ԍыланкыв" (1935) для молодцовского корпуса, текста русскоязычного издания "А. Л. Колесников. Из чего состоит вселенная" (1953) для параллельного корпуса и удмуртского текста учебника "Н. Н. Баранский. СССР географи" (1933) для корпуса удмуртского языка и параллельных корпусов.
  6. Пополнение словарной базы коми спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  7. Распространение комиязычного контента в соц. сетях.
  8. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.07.31.-2023.08.04

опубликовал Öньö Лав в 10:14 04.08.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.07.31.-2023.08.04
      

  1.  
  2. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye.
  3. Продолжение выборочного перевода с русского языка на коми язык новостных текстов федеральных средств массовой информации для параллельного корпуса ru-kv.
  4. Распознавание и вычитка в программе АВВYY FineReader текста переводного издания: "Александр Бек. Волоколамскӧй шоссе" (1948).
  5. Первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса по изданиям: "Александр Бек. Волоколамскӧй шоссе" (1948), "Иван Кожедуб. Служита Рӧдиналы" (1957).
  6. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №30) и журнала "Йӧлӧга" (2023. №7); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) и добавление в корпус коми языка.
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-08-01 и 1925-08-04, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  8. Продолжение распознавания и вычитки в программе АВВYY FineReader удмуртского текста учебника "Н. Н. Баранский. СССР географи" (1933) для корпуса удмуртского языка и параллельных корпусов.
  9. Пополнение словарной базы коми спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.07.24.-2023.07.28

опубликовал Öньö Лав в 0:16 28.07.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.07.24.-2023.07.28.
    

  1.  
  2. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye.
  3. Продолжение выборочного перевода с русского языка на коми язык новостных текстов федеральных средств массовой информации для параллельного корпуса ru-kv.
  4. Распознавание и вычитка в программе АВВYY FineReader текста переводного издания: "Иван Кожедуб. Служита Рӧдиналы" (1957).
  5. Первичное выравнивание в программе WinMerge коми текста с русскоязычным эквивалентом для параллельного корпуса по изданию: А. Гайдар "Лым крепостьса комендант" (1954).
  6. Сканирование отсутствовавших страниц книги "Л. Кассиль. Менам дона детинкаяс" (1948) по экземпляру из НБРК, распознавание текста и добавление в корпус коми языка.
  7. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №№ 28, 29) и журнала "Йӧлӧга" (2023. №5); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) и добавление в корпус коми языка.
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-07-23, 1925-07-25 (приложение "Комі ԍікт") и 1925-07-30, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  9.  Продолжение распознавания и вычитки в программе АВВYY FineReader удмуртского текста учебника "Н. Н. Баранский. СССР географи" (1933) для корпуса удмуртского языка и параллельных корпусов.
  10.  Подготовка трех текстов автора С. М. Морозов для публикации в журнале "Войвыв кодзув" по просьбе редакции.
  11. Пополнение словарной базы коми спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2023ʼ сора тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 0:32 21.07.2023

26.06.2023–21.07.2023.

  1.  
  2. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye.
  3. Продолжение выборочного перевода с русского языка на коми язык новостных текстов федеральных средств массовой информации (РБК, Интерфакс, Коммерсант) для параллельного корпуса ru-kv.
  4. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №25-27) и журнала "Йӧлӧга" (2023. №6); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Корректирование новостных текстов радио "Коми гор" за 2020 год. Удаление повторов из новостных текстов радио "Коми гор" за 2019-2020 год и разделеление собственно новостей и радиорепортажей по разным файлам.
  6. Распознавание и вычитка в программе ABBYY FineReader комиязычного текста книги "В. Каверин. Мужестволӧн школа" (1957) и его обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).        
  7. Загрузка в корпус коми языка новостных текстов радио "Коми гор" за 2019-2020 гг.,  последних номеров газеты "Коми му" и текста издания "В. Каверин. Мужестволӧн школа" (1957).
  8. Распознавание и вычитка в программе ABBYY FineReader русскоязычных текстов учебников "Н. Баранский. Физическая география СССР. Первая часть" (1935) и "С. Ф. Чефранов. Физическая география СССР. Районный обзор" (1937)  для дальнейшей параллелизации с коми переводами, проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer;
  9. Первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса по изданиям: "Баранский Н. Н. СССР-лӧн физическӧй география" (1939), "Чефранов С. В. СССР-лӧн физическӧй география. Вып. 2" (1941), "С. Григорьев. Малахов курган" (1952).
  10. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-07-07, 1925-07-09, 1925-07-11 (приложение "Комі ԍікт"), 1925-07-14, 1925-07-16, 1925-07-18 (приложение "Комі ԍікт") и 1925-07-21, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  11. Подготовка текстов автора А. А. Лыюров из корпуса коми языка для юбилейной публикации по просьбе Союза писателей РК.
  12. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Лемванырд (С. Терентьевлӧн 2008ʼ вося небӧг)", "Тӧвся войӧ (С. Терентьевлӧн 2022' вося небӧг)", "Пыж да лов (Е.  Афанасьевалӧн 2023ʼ вося небӧг)", "Лампа пӧч да Шурш (Л. Ануфриевалӧн 2023ʼ вося небӧг)", "Мӧд шонді (Л. Ануфриевалӧн 2022ʼ вося небӧг)", "Кумач морӧса жонь (А. Ванеевлӧн 2023ʼ вося небӧг)", "Сипсик — ловъя акань (Е. Цыпановлӧн 2023ʼ вося небӧг)".
  13. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии) удмуртских переводов учебников: "В. А. Тетюрев. Естествознание. 2 люкетэз : начальной школалы 4 кл. учебник " (1941), "Л. Г. Терехова, В. Г. Эрдели.  География. 2-тӥ люкетэз: начальной школалы ньылетӥ класслы. 7-тӥ изд." (1940), "М. П. Потёмкин но П. Г. Терехов. География. Взрослойёслӧн школаоссылы учебник" (1939) для корпуса удмуртского языка и параллельных корпусов.   
  14. Распознавание и вычитка в программе АВВYY FineReader удмуртского текста учебника "Н. Н. Баранский. СССР географи" (1933) для корпуса удмуртского языка и параллельных корпусов.
  15. Создание и заполнение на справочном wiki-ресурсе "Удмурт гожъяськет" отдельных страниц по десяти учебникам 1939-41 гг., страницы с современными правилами удмуртского правописания, страницы с полным списком вокабул удмуртского орфографического словаря и страницы с полным списком удмуртских словарей.
  16. Реконструкция удмуртского вариативного спелл-чеккера hunspell на основе новых подходов к описанию морфологии и пополнение словарной базы удмуртского спеллера лексикой, выявленной в текстах десяти распознанных изданий и лексикой, собранной сотрудниками отдела филологических исследований УИИЯЛ УдмФИЦ УрО РАН для грамматического парсера.
  17. Пополнение словарной базы коми спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  18. Распространение комиязычного контента в соц. сетях.
  19. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности
FU-Lab. 2023.07.17.-2023.07.21

опубликовал Öньö Лав в 21:31 20.07.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.07.17.-2023.07.21.

  1.  
  2. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye.
  3. Продолжение выборочного перевода с русского языка на коми язык новостных текстов федеральных средств массовой информации для параллельного корпуса ru-kv.
  4. Первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса по изданиям: "Баранский Н. Н. СССР-лӧн физическӧй география" (1939), "Чефранов С. В. СССР-лӧн физическӧй география. Вып. 2" (1941), "С. Григорьев. Малахов курган" (1952).
  5. Загрузка в корпус коми языка новостных текстов радио "Коми гор" за 2019-2020 гг. и последних номеров газеты "Коми му".
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-07-18 (приложение "Комі ԍікт") и 1925-07-21, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  7. Распознавание и вычитка в программе АВВYY FineReader удмуртского текста учебника "Н. Н. Баранский. СССР географи" (1933) для корпуса удмуртского языка и параллельных корпусов.
  8. Подготовка текстов автора А. А. Лыюров для юбилейной публикации по просьбе Союза писателей РК.
  9. Продолжение реконструкции удмуртского вариативного спелл-чеккера hunspell на основе новых подходов к описанию морфологии.
  10. Размещение списка удмуртских словарей на wiki-ресурсе «Удмурт гожъяськет».
  11. Пополнение словарной базы коми спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.07.10.-2023.07.14

опубликовал Öньö Лав в 23:38 13.07.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.07.10.-2023.07.14.
      

  1.  
  2. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye.
  3. Продолжение выборочного перевода с русского языка на коми язык новостных текстов федеральных средств массовой информации для параллельного корпуса ru-kv.
  4. Продолжение разделеления новостных текстов радио "Коми гор" за 2019-2020 на собственно тексты новостей и радиорепортажи по разным файлам.
  5. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №27) и журнала "Йӧлӧга" (2023. №6); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-07-11 (приложение "Комі ԍікт"), 1925-07-14 и 1925-07-16, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  7. Создание и заполнение на справочном wiki-ресурсе "Удмурт гожъяськет" отдельных страниц по девяти учебникам 1939-41 гг., страницы с современными правилами удмуртского правописания и страницы с полным списком вокабул удмуртского орфографического словаря.
  8. Реконструкция удмуртского вариативного спелл-чеккера hunspell на основе новых подходов к описанию морфологии и пополнение словарной базы удмуртского спеллера лексикой, собранной сотрудниками отдела филологических исследований УИИЯЛ УдмФИЦ УрО РАН для грамматического парсера.
  9. Пополнение словарной базы коми спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.07.03.-2023.07.07

опубликовал Öньö Лав в 21:32 06.07.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.07.03.-2023.07.07.
      

  1.  
  2. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye.
  3. Продолжение выборочного перевода с русского языка на коми язык новостных текстов федеральных средств массовой информации для параллельного корпуса ru-kv.
  4. Удаление повторов из новостных текстов радио "Коми гор" за 2019-2020 год и разделеление собственно новостей и радиорепортажей по разным файлам.
  5. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №26); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-07-09, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  7. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Лемванырд (С. Терентьевлӧн 2008ʼ вося небӧг)", "Тӧвся войӧ (С. Терентьевлӧн 2022' вося небӧг)".
  8. Распознавание и вычитка в программе ABBYY FineReader комиязычного текста книги "В. Каверин. Мужестволӧн школа" (1957); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  9. Распознавание и вычитка в программе ABBYY FineReader русскоязычных текстов учебников "Н. Баранский. Физическая география СССР. Первая часть" (1935) и "С. Ф. Чефранов. Физическая география СССР. Районный обзор"  для дальнейшей параллелизации с коми переводами, проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer;
  10. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии) удмуртских переводов учебника: "М. П. Потёмкин но П. Г. Терехов. География. Взрослойёслӧн школаоссылы учебник" (1939) для корпуса удмуртского языка и параллельных корпусов.
  11. Пополнение словарной базы удмуртского вариативного спелл-чеккера hunspell новой лексикой, выявленной в текстах десяти распознанных изданий и оптимизация его аффиксальной части.
  12. Пополнение словарной базы коми спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  13. Распространение комиязычного контента в соц. сетях.
  14. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.06.26.-2023.06.30

опубликовал Öньö Лав в 23:18 29.06.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.06.26.-2023.06.30.
      

  1.  
  2. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye.
  3. Продолжение выборочного перевода с русского языка на коми язык новостных текстов федеральных средств массовой информации для параллельного корпуса ru-kv.
  4. Корректирование новостных текстов радио "Коми гор" за 2020 год.
  5. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №25); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-07-07, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  7. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии) удмуртских переводов учебников: "В. А. Тетюрев. Естествознание. 2 люкетэз : начальной школалы 4 кл. учебник " (1941), "Л. Г. Терехова, В. Г. Эрдели.  География. 2-тӥ люкетэз: начальной школалы ньылетӥ класслы. 7-тӥ изд." (1940) для корпуса удмуртского языка и параллельных корпусов.
  8. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по комиязычным изданиям: "Пыж да лов (Е.  Афанасьевалӧн 2023ʼ вося небӧг)", "Лампа пӧч да Шурш (Л. Ануфриевалӧн 2023ʼ вося небӧг)", "Мӧд шонді (Л. Ануфриевалӧн 2022ʼ вося небӧг)", "Кумач морӧса жонь (А. Ванеевлӧн 2023ʼ вося небӧг)", "Сипсик — ловъя акань (Е. Цыпановлӧн 2023ʼ вося небӧг)".
  9. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
Яндекс.Метрика