2025ʼ лӧддза-номъя тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 15:46 24.06.2025

26.05.2025–24.06.2025

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 65, 67, 68, 69, 70, 71, 72-73, 74, 75, 79, 80).      
  3. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2025. №22, 23, 24, 25), журналов "Войвыв кодзув" (2025. №4, 5), "Би кинь" (2025 №№4,5), "Чушканзі" (2005, №№ 4, 5), "Йӧлӧга" (2025, №№ 4, 5), а также книжных изданий "Александр Шебырев. Меным югыдыс тырмис..." (2024), "Алёна Старцева. Нимкодь лоны капитанöн!" (2024); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов журнала "Комі му" (1925. № 11, 1926. №№ 5, 7, 8; 1927. №№ 3, 4-5), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус.
  5. Обработка в программе LibreOffice Writer текстов на коми латинице по изданиям: "A. Ꞑ. Kaвanov. Mortlən anatomija da fiⱬiologija. Ꞩər ꞩkolalь uçeвꞑik. 8-əd velədçan volь" (1934) и "A. Kişeļev. Algeвra. Ꞩər ꞩkolalь velədçan kꞑiga. Pervojja çaşţ. 6-əd da 7-əd vo velədçьşjaslь" (1934).
  6. Пополнение корпуса коми языка материалами, обработанными в лаборатории в течении истекшего месяца.
  7. Озвучка коми пословиц и идиом для образовательного портала "Коми кыв", обработка озвученных текстов в программе Audacity, сохранение их в отдельные mp3 файлы. Загрузка аудиофайлов на сервер, создание ссылкок на них с сайта komikyv.ru.
  8. Завершение проверки варианта на современной орфографии в программе LibreOffice Writer и корректирования оригинала  в программе Gedit удмуртского текста учебника "Н. Н. Баранский. СССР географи. Шор ёзо школаын 6 но 7 араз дышетон книга. Нырысетӥ люкетэз" (1933) и подготовка текста его русскоязычного источника для сравнения с переводом в программе WinMerge.
  9. Проверка вариантов на современной орфографии в программе LibreOffice Writer и корректирование оригиналов  в программе Gedit удмуртских текстов учебников "Л. Г. Терехова, В. Г. Эрдели. Географи. Нырысетӥ люкетэз. Одӥг ёзо школаысь куинетӥ арын дышетон книга" (1933),  "Л. Г. Терехова, В. Г. Эрдели. Географи. Кыкетӥ люкетэз. Одӥг ёзо школаын ньылетӥ араз дышетон книга" (1933), "В. А. Тетюрев. Естествознани. Нырысетӥ люкетэз. Одӥг ёзо школаын куинетӥ араз дышетон книга"  (1933), "М. Потёмкин, П. Терехов. Географи. Ӧжыт гожтэт тодӥсьёслы дышетскон книга" (1934) для национального корпуса удмуртского языка и дальнейшего выравнивания с коми текстом в параллельном корпусе пермских языков.   
  10. Распознавание в программе ABBYY FineReader текста удмуртского издания "В. А. Тетюрев. Естествознани. Ӧжыт гожтэт тодӥсьёсыз дышетон книга" (1934).
  11. Создание ссылок на ресурсы Национальной библиотеки Удмуртской Республики с таблицы удмуртоязычных книжных изданий 1933 и 1934 гг. на сайте "Удмурт гожъяськет".
  12. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельному номеру журнала "Войвыв кодзув" (2025 №№4, 5).
  13. Размещение произведений в онлайн-библиотеке "Коми гижӧд": И. Ногиев повесть "Женя".
  14. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Осий", "Йоиль", "Амос", "Авдий", "Иона", "Микей", "Наум", "Аввакум", "Софроний", "Аггей", "Закар", "Малакий").
  15. Пополнение ссылок на мобильные приложения по языкам народов Дальнего Востока на странице "Мобильные приложения" сайта wiki.fu-lab.ru.
  16. Устранение повторных представлений коллективных публикаций в общем списке и списке по авторам на сайте "Пермистика".
  17. Пополнение словарной базы коми и удмуртского спелл-чеккеров hunspell новой лексикой, выявленной в обрабатываемых текстах.
  18. Распространение комиязычного контента в соц. сетях.
  19. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности. 
  20. Выступление в программе "Ми тані олам" на КРТК "Юрган" с информацией текущем состоянии цифровизации коми языка, эфир 26.05.2025.
  21. Посещение паблик-тока "AI и IT: будущее национальных языков и культур в цифровом мире", проведенного на Красной площади в рамках мероприятия НацЛитФест. 05.06.2025.
FU-Lab. 2025.06.16.-2025.06.20

опубликовал Öньö Лав в 15:29 24.06.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.06.16.-2025.06.20

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 72-73, 74, 75).
  3. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2025. №25), а также книжных изданий "Александр Шебырев. Меным югыдыс тырмис..." (2024), "Алёна Старцева. Нимкодь лоны капитанöн!" (2024); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Обработка в программе LibreOffice Writer текстов на коми латинице по изданиям: "A. Ꞑ. Kaвanov. Mortlən anatomija da fiⱬiologija. Ꞩər ꞩkolalь uçeвꞑik. 8-əd velədçan volь" (1934) и "A. Kişeļev. Algeвra. Ꞩər ꞩkolalь velədçan kꞑiga. Pervojja çaşţ. 6-əd da 7-əd vo velədçьşjaslь" (1934).
  5. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов журнала "Комі му" (1927. № 8), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус.
  6. Пополнение корпуса коми языка материалами, обработанными в лаборатории в течении истекшего месяца.
  7. Озвучка идиом для образовательного портала "Коми кыв", обработка новой порции озвученных текстов в программе Audacity, сохранение их в отдельные mp3 файлы.
  8. Загрузка на сервер аудиофайлов пословиц и идиом, создание ссылкок на них с сайта komikyv.com.
  9. Распознавание в программе ABBYY FineReader текста удмуртского издания "В. А. Тетюрев. Естествознани. Ӧжыт гожтэт тодӥсьёсыз дышетон книга" (1934).
  10. Пополнение словарной базы коми и удмуртского спелл-чеккеров hunspell новой лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2025.06.09.-2025.06.11

опубликовал Öньö Лав в 10:58 16.06.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.06.09.-2025.06.11

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2025. №24), обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  3. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 71, 79, 80).
  4. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов журнала "Комі му" (1926. №№ 5, 7; 1927. №№ 3, 4-5), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус.
  5. Проверка вариантов на современной орфографии в программе LibreOffice Writer и корректирования оригиналов  в программе Gedit удмуртских текстов учебников "В. А. Тетюрев. Естествознани. Нырысетӥ люкетэз. Одӥг ёзо школаын куинетӥ араз дышетон книга"  (1933), "М. Потёмкин, П. Терехов. Географи. Ӧжыт гожтэт тодӥсьёслы дышетскон книга" (1934) для национального корпуса удмуртского языка и дальнейшего выравнивания с коми текстом в параллельном корпусе пермских языков.
  6. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2025.06.02.-2025.06.06

опубликовал Öньö Лав в 10:57 16.06.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.06.02.-2025.06.06

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2025. №23), журналов "Войвыв кодзув" (2025. №5), "Би кинь" (2025 №№4,5), "Чушканзі" (2005, №№ 4, 5), "Йӧлӧга" (2025, №№ 4, 5); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  3. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 69, 70).
  4. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельному номеру журнала "Войвыв кодзув" (2025 № 5).
  5. Размещение произведений в онлайн-библиотеке "Коми гижӧд": И. Ногиев повесть "Женя".
  6. Продолжение озвучка коми пословиц  и озвучка идиом для образовательного портала "Коми кыв", обработка новой порции озвученных текстов в программе Audacity, сохранение их в отдельные mp3 файлы.
  7. Проверка вариантов на современной орфографии в программе LibreOffice Writer и корректирования оригиналов  в программе Gedit удмуртских текстов учебников "Л. Г. Терехова, В. Г. Эрдели. Географи. Нырысетӥ люкетэз. Одӥг ёзо школаысь куинетӥ арын дышетон книга" (1933),  "Л. Г. Терехова, В. Г. Эрдели. Географи. Кыкетӥ люкетэз. Одӥг ёзо школаын ньылетӥ араз дышетон книга" (1933) для национального корпуса удмуртского языка и дальнейшего выравнивания с коми текстом в параллельном корпусе пермских языков.
  8. Создание ссылок на ресурсы Национальной библиотеки Удмуртской Республики с таблицы удмуртоязычных книжных изданий 1933 г. на сайте "Удмурт гожъяськет".
  9. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2025.05.26.-2025.05.30

опубликовал Öньö Лав в 10:09 02.06.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.05.26.-2025.05.30

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2025. №22) и журнала "Войвыв кодзув" (2025. №4), обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  3. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 65, 67, 68).
  4. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Осий", "Йоиль", "Амос", "Авдий", "Иона", "Микей", "Наум", "Аввакум", "Софроний", "Аггей", "Закар", "Малакий").
  5. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов журнала "Комі му" (1925. №№ 11), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус.
  6. Озвучка коми пословиц для образовательного портала "Коми кыв", обработка новой порции озвученных текстов в программе Audacity, сохранение их в отдельные mp3 файлы.
  7. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельному номеру журнала "Войвыв кодзув" (2025 № 4).
  8. Устранение повторных представлений коллективных публикаций в общем списке и списке по авторам на сайте "Пермистика".
  9. Завершение проверки варианта на современной орфографии в программе LibreOffice Writer и корректирования оригинала  в программе Gedit удмуртского текста учебника "Н. Н. Баранский. СССР географи. Шор ёзо школаын 6 но 7 араз дышетон книга. Нырысетӥ люкетэз" (1933) и подготовка текста его русскоязычного источника для сравнения с переводом в программе WinMerge.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности. 
  12. Выступление в программе "Ми тані олам" на КРТК "Юрган" с информацией текущем состоянии цифровизации коми языка, эфир 26.05.2025.
2025ʼ ода-кора тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 23:17 25.05.2025

28.04.2025–23.05.2025

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2025. №18, 19, 20, 21); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  3. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 52, 57, 58, 59, 60, 61, 62, 63-64, 66, 76, 77, 78).
  4. Корректирование текстов газеты «Коми му» за 1991 год (март) № 26, 27, 28, 29-30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48-49, 50, 51, 52.
  5. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Екклезиаст, 8-12", "Песнь песней", "Книга пророка Исаии", "Еремей пророклӧн небӧг", "Еремейлӧн бӧрданкыв", "Езекель пророклӧн небӧг", "Даниил пророклӧн небӧг 1-14").
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. № 22) и журнала "Комі му" (1925. №№ 1, 2; 1926. №№ 9, 10), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  7. Возобновление работы по переводу лексической базы для мобильного приложения по коми языку.
  8. Пополнение основного корпуса коми языка материалами, обработанными в лаборатории за последние недели.
  9. Обновление списков онлайн переводчиков и языковых корпусов на ресурсе wiki.fu-lab.ru
  10. Озвучка коми пословиц для образовательного портала "Коми кыв", обработка первой порции озвученных текстов в программе Audacity, сохранение их в отдельные mp3 файлы, загрузка на сервер и создание ссылкок с сайта komikyv.com.
  11. Размещение в онлайн-библиотеке "Коми гижӧд" произведения: "Е. Цыпанов. И Сордйыв грездын олысьяскӧд тшӧтш «тӧдмасьӧны» талун Эстонияын".  
  12. Восстановление стандартного редактора текстов на сайте онлайн библиотеки "Коми гижӧд".
  13. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer текста учебного издания на удмуртском языке "В. А. Тетюрев. Естествознание. Начальной школаын ньылетӥ классаз дышетон книга. Кыкетӥ люкетэз (1935)" для дальнейшего выравнивания с коми текстом в параллельном корпусе пермских языков.
  14. Консультирование коллег из УИИЯЛ УдмФИЦ УрО РАН по выравниванию стихотворных текстов при создании параллельного корпуса.
  15. Распространение комиязычного контента в соц. сетях.
  16. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  17. Участие в стратегической сессии "Информационные технологии и языки народов России", организованной Федеральным агентством по делам национальностей (г. Москва, 14-15 мая 2025 года). Выступление с докладом на тему "Опыт создания русско-коми языкового корпуса как текстовой базы для переводчика". 
  18. Проведение культурно-просветительного мероприятия "Коми язык в интернет пространстве" (2025-05-21).
FU-Lab. 2025.05.19.-2025.05.23

опубликовал Öньö Лав в 14:53 21.05.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.05.19.-2025.05.23

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2025. №21); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  3. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 62, 63-64, 66, 77, 78).
  4. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Еремей пророклӧн небӧг", "Еремейлӧн бӧрданкыв", "Езекель пророклӧн небӧг", "Даниил пророклӧн небӧг 1-14").
  5. Озвучка коми пословиц для образовательного портала "Коми кыв", обработка первой порции озвученных текстов в программе Audacity, сохранение их в отдельные mp3 файлы, загрузка на сервер и создание ссылкок с сайта komikyv.com.
  6. Размещение в онлайн-библиотеке "Коми гижӧд" произведения: "Е. Цыпанов. И Сордйыв грездын олысьяскӧд тшӧтш «тӧдмасьӧны» талун Эстонияын".
  7. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer текста учебного издания на удмуртском языке "В. А. Тетюрев. Естествознание. Начальной школаын ньылетӥ классаз дышетон книга. Кыкетӥ люкетэз (1935)" для дальнейшего выравнивания с коми текстом в параллельном корпусе пермских языков.
  8. Пополнение списка онлайн корпусов на ресурсе wiki.fu-lab.ru
  9. Восстановление стандартного редактора текстов на сайте онлайн библиотеки "Коми гижӧд".
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности. 
  12. Проведение культурно-просветительного мероприятия "Коми язык в интернет пространстве" (2025-05-21).
FU-Lab. 2025.05.12.-2025.05.16

опубликовал Öньö Лав в 22:52 15.05.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.05.12.-2025.05.16

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2025. №20); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  3. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 60, 61, 76).
  4. Корректирование текстов газеты «Коми му» за 1991 год (апрель) №№ 39, 40, 41, 42, 43, 44, 45, 46, 47, 48-49, 50, 51, 52.
  5. Пополнение основного корпуса коми языка материалами, обработанными в лаборатории за последние недели.
  6. Обновление списка онлайн переводчиков на ресурсе wiki.fu-lab.ru
  7. Распространение комиязычного контента в соц. сетях.
  8. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  9. Участие в стратегической сессии "Информационные технологии и языки народов России", организованной Федеральным агентством по делам национальностей (г. Москва, 14-15 мая 2025 года). Выступление с докладом на тему "Опыт создания русско-коми языкового корпуса как текстовой базы для переводчика".
FU-Lab. 2025.05.05.-2025.05.07

опубликовал Öньö Лав в 21:59 15.05.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.05.05.-2025.05.07
 

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2025. №18, 19); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  3. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№59).
  4. Корректирование текстов газеты «Коми му» за 1991 год (март) № 26, 27, 28, 29-30, 31, 32, 33, 34, 35, 36, 37, 38.
  5. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов журнала "Комі му" (1925. №№ 1, 2; 1926. №№ 9, 10), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус.
  6. Продолжение работы по переводу лексической базы для мобильного приложения по коми языку.
  7. Обновление списка языковых корпусов на ресурсе wiki.fu-lab.ru
  8. Консультирование коллег из УИИЯЛ УдмФИЦ УрО РАН по выравниванию стихотворных текстов при создании параллельного корпуса.
  9. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2025.04.28.-2025.04.30

опубликовал Öньö Лав в 21:53 15.05.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.04.28.-2025.04.30

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 52, 57, 58).
  3. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Екклезиаст, 8-12", "Песнь песней", "Книга пророка Исаии 1-58).
  4. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. № 22), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  5. Возобновление работы по переводу лексической базы для мобильного приложения по коми языку.
  6. Распространение комиязычного контента в соц. сетях.
2025ʼ косму тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 22:01 24.04.2025

24.03.2025–25.04.2025

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№ 37-38, 43-51, 53-56).
  3. Корректирование текстов газеты «Коми му» за 1991 год (№№ 14-25).
  4. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2025. №12-16), журналов "Би кинь" (2025. №№2, 3), "Чушканзі" (2025. №№ 2, 3), "Йӧлӧга" (2025. №№ 2, 3), "Войвыв кодзув" (2025. №№ 2, 3); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Извлечение текстов из pdf файла журнала "Би кинь" за 2006 г. (№№ 4, 6-8, 12); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Ездра", "Неемия", "Эсфирь", "Иов", "Псалтырь", "Притчи Соломоновы", "Екклезиаст, 1-7").
  7. Размещение произведений в онлайн-библиотеке "Коми гижӧд": А. Мишарина стих-я "Вильышпозъяс", "Куш муа няйтыс...", "Кӧдзыд пӧльыд Коми муад...", "Турӧб", "Асыв", "Сёр ар"; А. Ракин стих-е "Педӧр дядь"; В. Напалков стих-е "Кутла китӧ"; Е. Цыпанов статья "Быдӧнлы тӧдса кывъяс нянь да сов"; В. Лодыгин стих-е "Васьӧ касьӧ"; П. Бушенев стих-я "Рӧмпӧштан", "Тувъясигӧн", "Сир", "Коктӧм часі", "Повзьӧдіс"; В. Бабин стих-я "Мути", "«Пӧжасьысь»", "Колысь", "Ньӧбасьысь", "Коми гижӧд": Алёна Ельцова стихотворения "Увгӧ турӧб...", "Тӧвся вӧрын...", "Тӧрыт лунтыр буаліс...", "Зумышӧсь зэв коз пуяс...", Елена Афанасьева стих-я "Лым вылын чышъян", "Сёрмӧм лым"; Алёна Старцева стих-е "Ме тэнад кывбур, а тэ менам шылад..."; Алёна Ельцова стих-е "Алӧй дзоридз — войтурун..."; Нина Обрезкова стих-я "Муслунлӧн паметьысь...", "Мӧдысьсӧ тадзи жӧ ола...", "Чӧдъя гожӧм, чӧдъя вӧтъяс...", "Ёма", "Кывъясыс сэки вӧліны нин...", "Волім муслунӧдзыс...", "Тувччис мортыс му вылас ...", "Олӧмыс ньӧжмӧдас олӧмтӧ сы вылӧ...", "Сабри пинь коласад мый сӧмын оз сюрлы...", "Мынӧмаӧсь мамлӧн...", "Гажтӧмтча-ӧ ме гортсьым...", "Августнас карын...", "Чӧдъя гожӧм, чӧдъя вӧтъяс..."; Ольга Баженова стих-я "Кадыс ытва моз нуӧ-ньылалӧ...", "Чарла кывйӧн менӧ вундылісны…"; Зарни Люся рассказ "Шогтӧ он вузав, шудтӧ он ньӧб"; Евгений Цыпанов статья "Позьӧ шуны мӧд кывъясӧн да небыдджыка"; Анжелика Елфимова стих-я "Вӧтӧй вӧлі кисьмӧм гожӧма...", "Быд йылӧмлӧн аслас кось...", "Ӧткалуна", "Асывнас тотшкӧдчис тулыс...", "Кӧть кодкӧ тӧдӧ, мыйла тайӧ...", "Кӧть кодкӧ тӧдӧ, мыйла тайӧ...", "Пета потшӧс бокӧ...",  Иван Ногиев рассказ "Коді нӧ шышкыс?", Зарни Люся рассказ "Сюсь Сюзь", Серафим Попов поэма "Воркутаса бушков".
  8. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельному номеру журнала "Войвыв кодзув" (2025 № 2,3),  отдельных страниц по книжным изданиям на коми языке: "Меным югыдыс тырмис... (А. Шебыревлӧн 2024ʼ вося небӧг)", "Синва пӧль (Елена Афанасьевалӧн 2024ʼ вося небӧг)", "Менам нэм (И. А. Куратовлӧн 2024ʼ вося небӧг)", "Батьяс йылысь висьт (Нина Куратовалӧн 2024ʼ вося небӧг)", "Нимкодь лоны капитанöн! (Алёна Старцевалӧн 2024ʼ вося небӧг)", "Кышакылысь кад (Нина Обрезковалӧн 2024ʼ вося небӧг)", "Потандорса сьыланкывъяс (З. Остаповалӧн 2024ʼ вося небӧг)", "Лелькуйтчанкывъяс (З. Остаповалӧн 2024ʼ вося небӧг)", "Кывпесанъяс (З. Остаповалӧн 2024ʼ вося небӧг)", "Эскыны ловлы (И. А. Куратовлӧн 2024ʼ вося небӧг)", "Кыр йылын бӧрдіс гудӧк (Елена Козловалӧн 2024ʼ вося небӧг)", "Сёркни (Михаил Лебедевлӧн 2024ʼ вося небӧг)", "Пера-багатыр (2024ʼ вося небӧг)", "Шондібанӧй, Коми муӧй (В. Напалковлӧн 2022' вося небӧг)", "Аттьӧ тэныд, чужан сиктӧй, му вылас мый эм! (М. Матевалӧн 2022' вося небӧг)", "Путшкымдінса важ вераӧ эскысьяслӧн традицияяс да обрядъяс (М. Матевалӧн 2024ʼ вося небӧг)", "Олӧм пасъяс (М. Матевалӧн 2019' вося небӧг)", "Олӧм лӧсасъяс (М. Матевалӧн 2019' вося небӧг)", "Олӧм войтъяс (М. Матевалӧн 2019' вося небӧг)", "Сьӧлӧманым ловъяӧсь век... (2020ʼ вося небӧг)", "Художествоа коми литература челядь садйын лыддьӧм-видлалӧм (2003ʼ вося небӧг)", "Сёрнитыштам! (2022' вося небӧг)".
  9. Сборка и выравнивание текстов wiki-ресурса ruwiki.ru на коми и русском языках (выравнивание абзацев, проверка орфографии, выявление новой лексики и расстановка языковых тэгов. Оформление комиязычных текстов для пополнения лексической базы Корпуса коми языка.
  10. Выравнивание коми-зырянского (1936) и коми-пермяцкого (1937) переводов текста учебника: "Г. И. Иванов. География частей света и важнейших стран (без СССР)" с русскоязычным оригиналом. Пополнение таблицы параллельных предложений по данному изданию на сайте "Коми лингвистика".
  11. Приобретение, распознавание и вычитка в программе ABBYY FineReader и обработка  в программе LibreOffice Writer текстов русскоязычного оригинала учебника: "С. Варжанский и Л. Синицкий. География капиталистических стран. Учебник для средней школы. 6-й год обучения. Издание второе" (1934).  Выравнивание по предложениям русского текста с коми переводом 1933 года в программе WinMerge.
  12. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцкого издания на латинице: "С. Варжанскӧй да Л. Синицкӧй. Капиталистическӧй странаэзлӧн география. Шӧрӧт школа понда велӧтчан книга. 6-ӧт велӧтчан во" (1933).
  13. Постатейная разбивка PDF файла сборника "Пермистика 20" (2025). Загрузка файлов со статьями на сервер. Создание оглавления для данного сборника на сайте "Пермистика" со ссылками на отдельные статьи.
  14. Распространение комиязычного контента в соц. сетях.
  15. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2025.04.21.-2025.04.25

опубликовал Öньö Лав в 20:58 24.04.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.04.21.-2025.04.25

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№ 48-51, 55, 56).
  3. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №16); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Распространение комиязычного контента в соц. сетях.
  5. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2025.04.14.-2025.04.18

опубликовал Öньö Лав в 13:23 22.04.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.04.14.-2025.04.18

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№ 47, 53, 54).
  3. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №15); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Приобретение, распознавание и вычитка в программе ABBYY FineReader и обработка  в программе LibreOffice Writer текстов русскоязычного оригинала учебника: "С. Варжанский и Л. Синицкий. География капиталистических стран. Учебник для средней школы. 6-й год обучения. Издание второе" (1934).  Выравнивание по предложениям русского текста с коми переводом 1933 года в программе WinMerge.
  5. Сборка и выравнивание текстов wiki-ресурса ruwiki.ru на коми и русском языках (выравнивание абзацев, проверка орфографии, выявление новой лексики и расстановка языковых тэгов). Оформление комиязычных текстов для пополнения лексической базы Корпуса коми языка.
  6. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Художествоа коми литература челядь садйын лыддьӧм-видлалӧм (2003ʼ вося небӧг)", "Сёрнитыштам! (2022' вося небӧг)".
  7. Размещение произведений в онлайн-библиотеке "Коми гижӧд": Зарни Люся рассказ "Сюсь Сюзь", Серафим Попов поэма "Воркутаса бушков".
  8. Распространение комиязычного контента в соц. сетях.
  9. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2025.04.07.-2025.04.11

опубликовал Öньö Лав в 21:41 14.04.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.04.07.-2025.04.11

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№ 45, 46).
  3. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №13,14); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Сборка и выравнивание текстов wiki-ресурса ruwiki.ru на коми и русском языках (выравнивание абзацев, проверка орфографии, выявление новой лексики и расстановка языковых тэгов. Оформление комиязычных текстов для пополнения лексической базы Корпуса коми языка.
  5. Размещение в онлайн-библиотеке "Коми гижӧд" рассказа "Коді нӧ шышкыс?" автора Иван Ногиев.
  6. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Псалтырь, 40-151", "Притчи Соломоновы", "Екклезиаст, 1-7").
  7. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцкого издания на латинице: "С. Варжанскӧй да Л. Синицкӧй. Капиталистическӧй странаэзлӧн география. Шӧрӧт школа понда велӧтчан книга. 6-ӧт велӧтчан во" (1933).
  8. Постатейная разбивка PDF файла сборника "Пермистика 20" (2025). Загрузка файлов со статьями на сервер. Создание оглавления для данного сборника на сайте "Пермистика" со ссылками на отдельные статьи.
  9. Распространение комиязычного контента в соц. сетях.
  10. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2025.03.31.-2025.04.04

опубликовал Öньö Лав в 23:31 06.04.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.03.31.-2025.04.04

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№ 44).
  3. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №13), журналов "Би кинь" (2025. №3), "Чушканзі" (2025. №№ 2,3), "Йӧлӧга" (2025. №№ 2,3), "Войвыв кодзув" (2025. № 2,3); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельному номеру журнала "Войвыв кодзув" (2025 № 2,3),  отдельных страниц по книжным изданиям на коми языке: "Меным югыдыс тырмис... (А. Шебыревлӧн 2024ʼ вося небӧг)", "Синва пӧль (Елена Афанасьевалӧн 2024ʼ вося небӧг)", "Менам нэм (И. А. Куратовлӧн 2024ʼ вося небӧг)", "Батьяс йылысь висьт (Нина Куратовалӧн 2024ʼ вося небӧг)", "Нимкодь лоны капитанöн! (Алёна Старцевалӧн 2024ʼ вося небӧг)", "Кышакылысь кад (Нина Обрезковалӧн 2024ʼ вося небӧг)", "Потандорса сьыланкывъяс (З. Остаповалӧн 2024ʼ вося небӧг)", "Лелькуйтчанкывъяс (З. Остаповалӧн 2024ʼ вося небӧг)", "Кывпесанъяс (З. Остаповалӧн 2024ʼ вося небӧг)", "Эскыны ловлы (И. А. Куратовлӧн 2024ʼ вося небӧг)", "Кыр йылын бӧрдіс гудӧк (Елена Козловалӧн 2024ʼ вося небӧг)", "Сёркни (Михаил Лебедевлӧн 2024ʼ вося небӧг)", "Пера-багатыр (2024ʼ вося небӧг)", "Шондібанӧй, Коми муӧй (В. Напалковлӧн 2022' вося небӧг)", "Аттьӧ тэныд, чужан сиктӧй, му вылас мый эм! (М. Матевалӧн 2022' вося небӧг)", "Путшкымдінса важ вераӧ эскысьяслӧн традицияяс да обрядъяс (М. Матевалӧн 2024ʼ вося небӧг)", "Олӧм пасъяс (М. Матевалӧн 2019' вося небӧг)", "Олӧм лӧсасъяс (М. Матевалӧн 2019' вося небӧг)", "Олӧм войтъяс (М. Матевалӧн 2019' вося небӧг)", "Сьӧлӧманым ловъяӧсь век... (2020ʼ вося небӧг)".
  5. Размещение произведений в онлайн-библиотеке "Коми гижӧд": Елена Афанасьева стих-я "Лым вылын чышъян", "Сёрмӧм лым"; Алёна Старцева стих-е "Ме тэнад кывбур, а тэ менам шылад..."; Алёна Ельцова стих-е "Алӧй дзоридз — войтурун..."; Нина Обрезкова стих-я "Муслунлӧн паметьысь...", "Мӧдысьсӧ тадзи жӧ ола...", "Чӧдъя гожӧм, чӧдъя вӧтъяс...", "Ёма", "Кывъясыс сэки вӧліны нин...", "Волім муслунӧдзыс...", "Тувччис мортыс му вылас ...", "Олӧмыс ньӧжмӧдас олӧмтӧ сы вылӧ...", "Сабри пинь коласад мый сӧмын оз сюрлы...", "Мынӧмаӧсь мамлӧн...", "Гажтӧмтча-ӧ ме гортсьым...", "Августнас карын...", "Чӧдъя гожӧм, чӧдъя вӧтъяс..."; Ольга Баженова стих-я "Кадыс ытва моз нуӧ-ньылалӧ...", "Чарла кывйӧн менӧ вундылісны…"; Зарни Люся рассказ "Шогтӧ он вузав, шудтӧ он ньӧб"; Евгений Цыпанов статья "Позьӧ шуны мӧд кывъясӧн да небыдджыка"; Анжелика Елфимова стих-я "Вӧтӧй вӧлі кисьмӧм гожӧма...", "Быд йылӧмлӧн аслас кось...", "Ӧткалуна", "Асывнас тотшкӧдчис тулыс...", "Кӧть кодкӧ тӧдӧ, мыйла тайӧ...", "Кӧть кодкӧ тӧдӧ, мыйла тайӧ...", "Пета потшӧс бокӧ...".
  6. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Ездра", "Неемия", "Эсфирь", "Иов", "Псалтырь, 1-39").
  7. Распространение комиязычного контента в соц. сетях.
  8. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2025.03.24.-2025.03.28

опубликовал Öньö Лав в 13:56 03.04.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.03.24.-2025.03.28

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№ 37, 38, 43).
  3. Корректирование текстов газеты «Коми му» за 1991 год (январь) № 14-25.
  4. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №12) и журнала "Би кинь" (2025. №2); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Извлечение текстов из pdf файла журнала "Би кинь" за 2006 г. (№№ 4, 6-8, 12); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Размещение произведений в онлайн-библиотеке "Коми гижӧд": А. Мишарина стих-я "Вильышпозъяс", "Куш муа няйтыс...", "Кӧдзыд пӧльыд Коми муад...", "Турӧб", "Асыв", "Сёр ар"; А. Ракин стих-е "Педӧр дядь"; В. Напалков стих-е "Кутла китӧ"; Е. Цыпанов статья "Быдӧнлы тӧдса кывъяс нянь да сов"; В. Лодыгин стих-е "Васьӧ касьӧ"; П. Бушенев стих-я "Рӧмпӧштан", "Тувъясигӧн", "Сир", "Коктӧм часі", "Повзьӧдіс"; В. Бабин стих-я "Мути", "«Пӧжасьысь»", "Колысь", "Ньӧбасьысь", "Коми гижӧд": Алёна Ельцова стихотворения "Увгӧ турӧб...", "Тӧвся вӧрын...", "Тӧрыт лунтыр буаліс...", "Зумышӧсь зэв коз пуяс...".
  7. Выравнивание коми-зырянского (1936) и коми-пермяцкого (1937) переводов текста учебника: "Г. И. Иванов. География частей света и важнейших стран (без СССР)" с русскоязычным оригиналом. Пополнение таблицы параллельных предложений по данному изданию на сайте "Коми лингвистика".
  8. Распространение комиязычного контента в соц. сетях.
2025ʼ вося медводдза кварталысь отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 13:39 03.04.2025

2024.12.23.-2025.03.21.

2. Работа в рамках пополнения параллельного корпуса (kv-ru) и текстовой базы машинного переводчика:

2.1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.

2.2. Редактирование эталон-сета для МКАО "Яндекс".

2.3. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Бытие", "Исход", "Левит", "Числа", "Второзаконие", "Иисуса Навина", "Судьи", "Руфь", "Царств, 1-4", "Паралипоменон, 1-2").

2.4. Сборка и выравнивание текстов новой интернет-энциклопедии ruwiki.ru на коми и русском языках.

2.5. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer текстов электроного pdf-издания "Книга Почёта" (2024) на коми и русском языках (выравнивание абзацев, проверка орфографии, выявление новой лексики и расстановка языковых тэгов), разделение коми и русских текстов по разным файлам, разбивка текстов на строки и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Создание фотокопий номеров газеты «Югыд туй» за первое полугодие 1990 года и газеты «Коми му» за 1991 год.

3.2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка) текстов номеров газет «Югыд туй» за 1990 г. (№№ 1, 2, 145, 153, 154, 155, 156) и «Коми му» за 1991 г. (№ 1-36, 39-42).

3.3. Корректирование текстов газеты «Югыд туй» за 1990 г. (№ 152, 153, 154, 155, 156) и «Коми му» за 1991 год (№ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13).

3.4. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) текстов журнала "Би кинь" (2004. №2; 2007. №11; 2010. №9; 2017. №№4, 9).

3.5. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2024. №52, 2025, №№1-11), журналов  "Йӧлӧга" (2024. № 12, 2025. № 1), "Чушканзі" (2024 №12; 2025 №1), "Би кинь" (2024. №12; 2025. №1), "Войвыв кодзув" (2024. №12, 2025. № 1); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).

3.6. Распознавание в программе ABBYY FineReader комиязычного издания "Е. А. Цыпанов. Перым коми гижӧд кыв" (1999).

3.7. Извлечение текстов из редакторской pdf копии издания А. Мишарина "Кармылькйын гожӧм" (2013), обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).

3.8. Оформление комиязычных текстов wiki-ресурса ruwiki.ru в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики и расстановка языковых тэгов).

3.9. Исправление ошибки в поисковой системе корпуса, связанной с поиском по лемме слов с прописной буквы.

3.10. Сборка и метеразметка текстов нового перевода Библии на коми язык.

3.11. Добавление в корпус коми языка текстов, обработанных за отчетный период.

Объём корпуса коми языка за отчетный период возрос на 953 465 единиц и к 2025-03-21 составляет 88 067 522 словоупотреблений.

4. Текстовое пополнение молодцовского корпуса:

4.1. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926 №№ 17, 18, 19, 20, 21), их обработка в программе LibreOffice Writer и загрузка в молодцовский корпус.

5. Пополнение онлайн библиотеки "Коми гижӧд":

5.1. Размещение произведений в онлайн-библиотеке "Коми гижӧд": А. Мишарин "Кармылькйын гожӧм", "Чепӧлышъяс".

5.2. Размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд" 5 номеров газеты "Комі ԍікт" за 1926 год (№№ 17-21).

6. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

6.1. Библиографическое пополнение станицы "Коми му (газет; юриндалысь) 2020-2024" справочного wiki-ресурса "Коми тӧданін".

6.2. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельному номеру журнала "Войвыв кодзув" (2024 № 12).

6.3. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Чужан муыд быдӧнлы колӧ (Э. Поляковалӧн 2024ʼ вося небӧг)", "Кӧдзыд пӧль (А. Сукгоевалӧн 2024ʼ вося небӧг)", "Ылӧ кольӧм вояс (Е. А. Игушевлӧн 2024ʼ вося небӧг)", "Коми Республикаса Почёт книга (2024ʼ вося небӧг)",  "Кармылькйын гожӧм (А. Мишаринлӧн 2013ʼ вося небӧг)".

6.4. Создание и заполнение wiki-страниц с оглавлением по номерам газеты "Комі ԍікт" за 1926 год (№№ 17-21) в онлайн-справочнике "Коми тӧданін".

7. Работа с лексической базой FU-Lab:

7.1. Внесение правок в текст "Коми-пермяцко-русского словаря" на сайте "Онлайн-словари FU-Lab".

8. Преобразования на образовательном портале komikyv.ru

8.1. Загрузка видеороликов по коми грамматике на хостинги Rutube и VK Видео.  

8.2. Заменна ссылок на видеоролики с сайта komikyv.ru. Вместо Youtube они теперь ведут на Rutube.

9. Создание мультиязычного корпуса по пермским языкам:

9.1. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "В. Н. Львов. Мый му пытшкын?" (1935), "В. Н. Львов. Музэгалӧммез" (1935), "В. Н. Львов. Вулканнэз" (1936), "В. А. Тетюрев. Природатӧдӧм. 1 тор. Куимӧт велӧтчан во" (1934), "В. А. Тетюрев. Природатӧдӧм. Мӧдік тор. Нёльӧт велӧтчан во" (1933), "И. Борисов, Е. Марова, Л. Павличева, В. Тетюрев. Природатӧдӧм. Етша велӧтчӧм йӧзлӧ" (1933), "П. Веприков, В. Ившин. Быдмас. Кыдз сія олӧ, кыдз керӧм да кытшӧм сетӧ польза" (1934), "В. Г. Фридман. Мый вылын видзсьӧ му" (1934), "Терехова Л. Г, Эрдели В. Г. География. Медодзза тор. Куимӧт велӧтчан во" (1934), "Терехова Л. Г, Эрдели В. Г. География. Мӧдік тор. Нёльӧт класслӧ велӧтчан книга" (1934), "М. Потёмкин да П. Терехов. География. Учӧт грамотаа школаэз понда велӧтчан книга" (1934), "Д-р Ф. А. Копылов. Любознательнӧйезлӧн клуб" (1934), "А. А. Шибанов да мӧд. Природа тӧдмалан книга. Куимӧт во" (1932), "Н. А. Репина. Природа тӧдмалан книга. IV во велӧтчиссезлӧ" (1932), "Г. И. Фалеев, А. В. Перышкин. Физика. Шӧрӧт школа понда велӧтчан книга. 5-ӧт велӧтчан во" (1933), "Л. Г. Терехова, В. Г. Эрдели. География. Медодзза часть. Медодзза школа понда куимӧт класслӧ велӧтчан книга" (1936), "Л. Г. Терехова, В. Г. Эрдели. География. Мӧдік часть. Медодзза школа понда нёльӧт класслӧ велӧтчан книга" (1936),  "А. С. Барков, А. А. Половинкин. Физическӧй география. Шӧрӧт школа понда витӧт класслӧ велӧтчан книга" (1936),  "Н. Н. Баранский. ССР Союзлӧн физическӧй география. Шӧрӧт школа понда сизимӧт класслӧ велӧтчан книга" (1936), "Г. И. Иванов. География свет часттезлӧн да важнейшӧй странаэзлӧн (СССР-тӧг). Небытса шӧрӧт да шӧрӧт школа понда 6-ӧт класслӧ велӧтчан книга" (1936).

9.2. Выравнивание переводов текста учебника: "Г. И. Иванов. География частей света и важнейших стран (без СССР)" на коми-зырянском (1936) и коми-пермяцком (1937) языках. Создание таблицы параллельных предложений по данному изданию на сайте "Коми лингвистика".

9.3. Вычитка варианта на современной орфографии и корректирование в программе LibreOffice Writer удмуртского текста учебника "Н. Н. Баранский. СССР географи. Шор ёзо школаын 6 но 7 араз дышетон книга. Нырысетӥ люкетэз" (1933).

10. По лингвистическому ресурсу "Коми кывтӧдӧм":

10.1. Сканирование, создание pdf копий и размещение на сайте "Коми кывтӧдӧм" лингвистических изданий: "Г. В. Федюнева. Коми местоимение: к проблеме формального варьирования в языке" (2000), "Г. В. Федюнева. Местоимения 1-го и 2-го лица в пермских языках: исторические параллели" (2006), Г. В. Федюнева. Указательные местоимения и их производные в пермских языках" (2007).

11. Пополнение словарной базы средства проверки правописания Hunspell:

11.1. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.

12. Иное

12.1. Тестирование аудиозаписывающего оборудования в ИЯЛИ КНЦ УрО РАН для дальнейшей работы по созданию аудиокорпуса.

12.2. Работа по обучению практиканта, направленного КРАГСиУ, работе по распознаванию текстов в программе ABBYY FineReader, извлечению текстов из pdf-файлов.  

12.3. Обновление презентации по продуктам и ресурсам Лаборатории FU-Lab для показа на «Республиканском фестивале мастер-классов среди педагогических работников Республики Коми по сохранению коми языка, культуры и традиций».

12.4. Распространение комиязычного контента в соц. сетях.

12.5. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

2025ʼ рака тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 0:27 24.03.2025

24.02.202521.03.2025

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№  24, 25, 27, 28, 29-30, 31, 39, 32, 33, 40, 41, 34, 35, 36, 42).
  3. Редактирование текстов газеты «Югыд туй» за 1990 г. (№ 152, 153, 154, 155, 156) и «Коми му» за 1991 год (№ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13).
  4. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №8-11); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Извлечение текстов из редакторской pdf копии издания А. Мишарина "Кармылькйын гожӧм" (2013)
  6. Размещение произведений в онлайн-библиотеке "Коми гижӧд": А. Мишарин "Кармылькйын гожӧм", "Чепӧлышъяс";
  7. Заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по книжному изданию на коми языке: "Кармылькйын гожӧм (А. Мишаринлӧн 2013ʼ вося небӧг)";
  8. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) текстов журнала "Би кинь" (2004. №2; 2007. №11; 2010. №9; 2017. №№4, 9).
  9. Продолжение сборки и выравнивания текстов wiki-ресурса ruwiki.ru на коми и русском языках. Оформление комиязычных текстов для пополнения лексической базы Корпуса коми языка (выравнивание абзацев, проверка орфографии, выявление новой лексики и расстановка языковых тэгов).
  10. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Судьи", "Руфь", "Царств, 1-4", "Паралипоменон, 1-2").
  11. Работа по обучению практиканта, направленного КРАГСиУ, работе по распознаванию текстов в программе ABBYY FineReader, извлечению текстов из pdf-файлов.
  12. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. №№ 20, 21), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  13. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "Г. И. Иванов. География свет часттезлӧн да важнейшӧй странаэзлӧн (СССР-тӧг). Небытса шӧрӧт да шӧрӧт школа понда 6-ӧт класслӧ велӧтчан книга" (1936).
  14. Выравнивание переводов текста учебника: "Г. И. Иванов. География частей света и важнейших стран (без СССР)" на коми-зырянском (1936) и коми-пермяцком (1937) языках. Создание таблицы параллельных предложений по данному изданию на сайте "Коми лингвистика".
  15. Тестирование аудиозаписывающего оборудования в ИЯЛИ КНЦ УрО РАН для дальнейшей работы по созданию аудиокорпуса.        
  16. Обновление презентации по продуктам и ресурсам Лаборатории FU-Lab для показа на «Республиканском фестивале мастер-классов среди педагогических работников Республики Коми по сохранению коми языка, культуры и традиций».
  17. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2025.03.17.-2025.03.21

опубликовал Öньö Лав в 23:47 23.03.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.03.17.-2025.03.21

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№ 34, 35, 36, 42).
  3. Редактирование текстов газеты «Коми му» за 1991 год (январь) № 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13.
  4. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №11); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. №№ 20, 21), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  6. Извлечение текстов из редакторской pdf копии издания А. Мишарина "Кармылькйын гожӧм" (2013)
  7. Размещение произведений в онлайн-библиотеке "Коми гижӧд": А. Мишарин "Кармылькйын гожӧм", "Чепӧлышъяс";
  8. Заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по книжному изданию на коми языке: "Кармылькйын гожӧм (А. Мишаринлӧн 2013ʼ вося небӧг)";
  9. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) текстов журнала "Би кинь" (2004. №2; 2007. №11; 2010. №9; 2017. №№4, 9).
  10. Работа по обучению практиканта, направленного КРАГСиУ, работе по распознаванию текстов в программе ABBYY FineReader, извлечению текстов из pdf-файлов.
  11. Выравнивание переводов текста учебника: "Г. И. Иванов. География частей света и важнейших стран (без СССР)" на коми-зырянском (1936) и коми-пермяцком (1937) языках. Создание таблицы параллельных предложений по данному изданию на сайте "Коми лингвистика".
  12. Распространение комиязычного контента в соц. сетях
FU-Lab. 2025.03.10.-2025.03.14

опубликовал Öньö Лав в 12:02 17.03.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.03.10.-2025.03.14

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 32, 33, 40, 41).
  3. Извлечение из pdf файла текстов свежего номера газеты «Коми му» (2025. №10); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов)
  4. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Царств, 3-4", "Паралипоменон, 1-2").
  5. Завершение распознавания и вычитки в программе ABBYY FineReader текстов коми-пермяцкого издания на латинице: "Г. И. Иванов. География свет часттезлӧн да важнейшӧй странаэзлӧн (СССР-тӧг). Небытса шӧрӧт да шӧрӧт школа понда 6-ӧт класслӧ велӧтчан книга" (1936).
  6. Обновление презентации по продуктам и ресурсам Лаборатории FU-Lab для показа на «Республиканский фестиваль мастер-классов среди педагогических работников Республики Коми по сохранению коми языка, культуры и традиций».
  7. Работа по обучению практиканта, направленного КРАГСиУ, работе по распознаванию текстов в программе ABBYY FineReader и публикации художественных произведений в ресурсе http://komikyv.org.
  8. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2025.03.03.-2025.03.07

опубликовал Öньö Лав в 17:25 10.03.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.03.03.-2025.03.07

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 29-30, 31, 39).
  3. Редактирование текстов газеты «Югыд туй» за 1990 г. (№ 152, 153, 154, 155, 156).
  4. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №9); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Продолжение распознавания и вычитки в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "Г. И. Иванов. География свет часттезлӧн да важнейшӧй странаэзлӧн (СССР-тӧг). Небытса шӧрӧт да шӧрӧт школа понда 6-ӧт класслӧ велӧтчан книга" (1936).
  6. Работа по обучению практиканта, направленного КРАГСиУ, работе по распознаванию текстов в программе ABBYY FineReader.
  7. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2025.02.24.-2025.02.28

опубликовал Öньö Лав в 11:04 02.03.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.02.24.-2025.02.28

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 24, 25, 27, 28).
  3. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №8); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Продолжение сборки и выравнивания текстов wiki-ресурса ruwiki.ru на коми и русском языках. Оформление комиязычных текстов для пополнения лексической базы Корпуса коми языка (выравнивание абзацев, проверка орфографии, выявление новой лексики и расстановка языковых тэгов).
  5. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Судьи", "Руфь", "Царств, 1-2").
  6. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "Г. И. Иванов. География свет часттезлӧн да важнейшӧй странаэзлӧн (СССР-тӧг). Небытса шӧрӧт да шӧрӧт школа понда 6-ӧт класслӧ велӧтчан книга" (1936).
  7. Тестирование аудиозаписывающего оборудования в ИЯЛИ КНЦ УрО РАН для дальнейшей работы по созданию аудиокорпуса.
  8. Распространение комиязычного контента в соц. сетях.
2025ʼ урасьӧм тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 11:05 23.02.2025

2025.01.27.-2025.02.21

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Редактирование эталон-сета для МКАО "Яндекс".
  3. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка  в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 11, 12, 18, 19, 20, 21, 22, 23, 26).
  4. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2025. №4-7), журналов  "Йӧлӧга" (2024. № 12, 2025. № 1), "Чушканзі" (2024 №12; 2025 №1), "Би кинь" (2024. №12; 2025. №1), "Войвыв кодзув" (2024. №12, 2025. № 1); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов)
  5. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer текстов электроного pdf-издания "Книга Почёта" (2024) на коми и русском языках (выравнивание абзацев, проверка орфографии, выявление новой лексики и расстановка языковых тэгов), разделение коми и русских текстов по разным файлам, разбивка текстов на строки и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.
  6. Сборка и выравнивание текстов wiki-ресурса ruwiki.ru на коми и русском языках (выравнивание абзацев, проверка орфографии, выявление новой лексики и расстановка языковых тэгов). Оформление комиязычных текстов для пополнения лексической базы Корпуса коми языка.
  7. Продолжение распознавания в программе ABBYY FineReader комиязычного издания "Е. А. Цыпанов. Перым коми гижӧд кыв" (1999).
  8. Завершение сборки текстов нового перевода текстов Ветхого завета на коми язык, метаразметка и загрузка в корпус коми языка.
  9. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Бытие", "Исход", "Левит", "Числа", "Второзаконие", "Иисуса Навина").
  10. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "Г. И. Фалеев, А. В. Перышкин. Физика. Шӧрӧт школа понда велӧтчан книга. 5-ӧт велӧтчан во" (1933), "Л. Г. Терехова, В. Г. Эрдели. География. Медодзза часть. Медодзза школа понда куимӧт класслӧ велӧтчан книга" (1936), "Л. Г. Терехова, В. Г. Эрдели. География. Мӧдік часть. Медодзза школа понда нёльӧт класслӧ велӧтчан книга" (1936),  "А. С. Барков, А. А. Половинкин. Физическӧй география. Шӧрӧт школа понда витӧт класслӧ велӧтчан книга" (1936),  "Н. Н. Баранский. ССР Союзлӧн физическӧй география. Шӧрӧт школа понда сизимӧт класслӧ велӧтчан книга" (1936).
  11. Библиографическое пополнение станицы "Коми му (газет; юриндалысь) 2020-2024" справочного wiki-ресурса "Коми тӧданін"
  12. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельному номеру журнала "Войвыв кодзув" (2024 № 12).
  13. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Коми Республикаса Почёт книга (2024ʼ вося небӧг)".
  14. Загрузка видеороликов по коми грамматике на хостинги Rutube и VK Видео.  
  15. Заменна ссылок на видеоролики с сайта komikyv.ru. Вместо Youtube они теперь ведут на Rutube.
  16. Тестирование аудиозаписывающего оборудования в ИЯЛИ КНЦ УрО РАН для дальнейшей работы по созданию аудиокорпуса.
  17. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  18. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  19. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2025.02.17.-2025.02.21

опубликовал Öньö Лав в 19:52 21.02.2025

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.02.17.-2025.02.21

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Сборка и выравнивание текстов wiki-ресурса ruwiki.ru на коми и русском языках (выравнивание абзацев, проверка орфографии, выявление новой лексики и расстановка языковых тэгов). Оформление комиязычных текстов для пополнения лексической базы Корпуса коми языка.
  3. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №7); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Распознавание и вычитка в программе ABBYY FineReader и обработка LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 21, 22, 23) в программе LibreOffice Writer.
  5. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Числа", "Второзаконие", "Иисуса Навина").
  6. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "Н. Н. Баранский. ССР Союзлӧн физическӧй география. Шӧрӧт школа понда сизимӧт класслӧ велӧтчан книга" (1936).
  7. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  8. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  9. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2025.02.10.-2025.02.14

опубликовал Öньö Лав в 20:07 15.02.2025

​В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.02.10.-2025.02.14

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Завершение редактирования эталон-сета для МКАО "Яндекс".
  3. Продолжение загрузки видеороликов по коми грамматике на хостинги Rutube и VK Видео и заменны ссылок на видеоролики с сайта komikyv.ru. 
  4. Первичное выравнивание в программе WinMerge коми текстов нового перевода "Ветхого завета" с русскоязычными эквивалентами (книги "Бытие", "Исход", "Левит").
  5. Тестирование аудиозаписывающего оборудования в ИЯЛИ КНЦ УрО РАН для дальнейшей работы по созданию аудиокорпуса.
  6. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №6); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  7. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader и обработка  в программе LibreOffice Writer текстов газеты «Коми му» за 1991 г. (№№ 20, 26).
  8. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer текстов электроного pdf-издания "Книга Почёта" (2024) на коми и русском языках (выравнивание абзацев, проверка орфографии, выявление новой лексики и расстановка языковых тэгов), разделение коми и русских текстов по разным файлам, разбивка текстов на строки и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.
  9. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Коми Республикаса Почёт книга (2024ʼ вося небӧг)".
  10. Библиографическое пополнение станицы "Коми му (газет; юриндалысь) 2020-2024" справочного wiki-ресурса "Коми тӧданін"
  11. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "А. С. Барков, А. А. Половинкин. Физическӧй география. Шӧрӧт школа понда витӧт класслӧ велӧтчан книга" (1936).
  12. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  14. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2025.02.03.-2025.02.07

опубликовал Öньö Лав в 18:22 13.02.2025

​В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.02.03.-2025.02.07

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Продолжение редактирования эталон-сета для МКАО "Яндекс".
  3. Загрузка видеороликов по коми грамматике на хостинги Rutube и VK Видео.
  4. Заменна ссылок на видеоролики с сайта komikyv.ru. Вместо Youtube они теперь ведут на Rutube.
  5. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2025. №5), журналов  "Йӧлӧга" (2024. № 12, 2025. № 1), "Чушканзі" (2024 №12; 2025 №1), "Би кинь" (2024. №12; 2025. №1), "Войвыв кодзув" (2025. № 1); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов)
  6. Распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer текста газеты «Коми му» (1991. № 19).
  7. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "Л. Г. Терехова, В. Г. Эрдели. География. Мӧдік часть. Медодзза школа понда нёльӧт класслӧ велӧтчан книга" (1936).
  8. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  9. Распространение комиязычного контента в соц. сетях.
     
FU-Lab. 2025.01.27.-2025.01.31

опубликовал Öньö Лав в 19:17 30.01.2025

​В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.01.27.-2025.01.31

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание pdf файлов из фотокопий, распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, метаразметка) текстов газеты «Коми му» (1991. № 11, 12, 18).
  3. Извлечение из pdf файла текстов свежего номера газеты «Коми му» (2025. №4); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Извлечение из pdf файла текстов свежего номера журнала "Войвыв кодзув" (2024. № 12); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельному номеру журнала "Войвыв кодзув" (2024 № 12).
  6. Редактирование эталон-сета для МКАО "Яндекс".
  7. Завершение сборки текстов нового перевода текстов Ветхого завета на коми язык, метаразметка и загрузка в корпус коми языка.
  8. Продолжение распознавания в программе ABBYY FineReader комиязычного издания "Е. А. Цыпанов. Перым коми гижӧд кыв" (1999).
  9. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "Г. И. Фалеев, А. В. Перышкин. Физика. Шӧрӧт школа понда велӧтчан книга. 5-ӧт велӧтчан во" (1933), "Л. Г. Терехова, В. Г. Эрдели. География. Медодзза часть. Медодзза школа понда куимӧт класслӧ велӧтчан книга" (1936).
  10. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
2025ʼ тӧвшӧр тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 11:55 24.01.2025

2024.12.23.-2025.01.24.

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание фотокопий номеров газеты «Югыд туй» за первое полугодие 1990 года и газеты «Коми му» за 1991 год.
  3. Распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка) текстов номеров газет «Югыд туй» (1990. №№ 1, 2, 145, 153, 154, 155, 156) и «Коми му» (1990. № 1-10, 14-17).
  4. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2024. №52, 2025, №№1-3); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Начало распознавания в программе ABBYY FineReader комиязычного издания "Е. А. Цыпанов. Перым коми гижӧд кыв" (1999).
  6. Сборка для корпуса коми языка текстов нового перевода Библии на коми язык (книги "Олӧм", "Петӧм", "Левит", "Лыд", "Индӧд", "Нав Исус", "Ёрдысьяс", "Руфа", "Ӧксыяслӧн небӧгъяс", "Кад небӧгъяс").
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926 №№ 17, 18, 19), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  8. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "В. Н. Львов. Мый му пытшкын?" (1935), "В. Н. Львов. Музэгалӧммез" (1935), "В. Н. Львов. Вулканнэз" (1936), "В. А. Тетюрев. Природатӧдӧм. 1 тор. Куимӧт велӧтчан во" (1934), "В. А. Тетюрев. Природатӧдӧм. Мӧдік тор. Нёльӧт велӧтчан во" (1933), "И. Борисов, Е. Марова, Л. Павличева, В. Тетюрев. Природатӧдӧм. Етша велӧтчӧм йӧзлӧ" (1933), "П. Веприков, В. Ившин. Быдмас. Кыдз сія олӧ, кыдз керӧм да кытшӧм сетӧ польза" (1934), "В. Г. Фридман. Мый вылын видзсьӧ му" (1934), "Терехова Л. Г, Эрдели В. Г. География. Медодзза тор. Куимӧт велӧтчан во" (1934), "Терехова Л. Г, Эрдели В. Г. География. Мӧдік тор. Нёльӧт класслӧ велӧтчан книга" (1934), "М. Потёмкин да П. Терехов. География. Учӧт грамотаа школаэз понда велӧтчан книга" (1934), "Д-р Ф. А. Копылов. Любознательнӧйезлӧн клуб" (1934), "А. А. Шибанов да мӧд. Природа тӧдмалан книга. Куимӧт во" (1932), "Н. А. Репина. Природа тӧдмалан книга. IV во велӧтчиссезлӧ" (1932).
  9. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Чужан муыд быдӧнлы колӧ (Э. Поляковалӧн 2024ʼ вося небӧг)", "Кӧдзыд пӧль (А. Сукгоевалӧн 2024ʼ вося небӧг)", "Ылӧ кольӧм вояс (Е. А. Игушевлӧн 2024ʼ вося небӧг)".
  10. Сканирование, создание pdf копий и размещение на сайте "Коми кывтӧдӧм" лингвистических изданий: "Г. В. Федюнева. Коми местоимение: к проблеме формального варьирования в языке" (2000), "Г. В. Федюнева. Местоимения 1-го и 2-го лица в пермских языках: исторические параллели" (2006), Г. В. Федюнева. Указательные местоимения и их производные в пермских языках" (2007).
  11. Внесение правок в текст "Коми-пермяцко-русского словаря" на сайте "Онлайн-словари FU-Lab".
  12. Вычитка варианта на современной орфографии и корректирование в программе LibreOffice Writer удмуртского текста учебника "Н. Н. Баранский. СССР географи. Шор ёзо школаын 6 но 7 араз дышетон книга. Нырысетӥ люкетэз" (1933).
  13. Исправление ошибки в поисковой системе корпуса, связанной с поиском по лемме слов с прописной буквы.
  14. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  15. Распространение комиязычного контента в соц. сетях.
  16. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2025.01.20.-2025.01.24

опубликовал Öньö Лав в 11:39 24.01.2025

​В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.01.20.-2025.01.24

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание фотокопий номеров газеты «Коми му» за второе полугодие 1991 года.
  3. Создание pdf файлов из фотокопий газеты «Коми му» (1991. № 9-11).
  4. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) текстов газеты «Коми му» (1991. № 9, 10, 16, 17).
  5. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2025. №3); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Начало распознавания в программе ABBYY FineReader комиязычного издания "Е. А. Цыпанов. Перым коми гижӧд кыв" (1999).
  7. Сборка для корпуса текстов нового перевода Библии на коми язык (книги "Ӧксыяслӧн небӧгъяс", "Кад небӧгъяс").
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926 №№ 19), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  9. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "Н. А. Репина. Природа тӧдмалан книга. IV во велӧтчиссезлӧ" (1932).
  10. Сканирование, создание pdf копий и размещение на сайте "Коми кывтӧдӧм" лингвистических изданий: "Г. В. Федюнева. Коми местоимение: к проблеме формального варьирования в языке" (2000), "Г. В. Федюнева. Местоимения 1-го и 2-го лица в пермских языках: исторические параллели" (2006), Г. В. Федюнева. Указательные местоимения и их производные в пермских языках" (2007).
  11. Внесение правок в текст "Коми-пермяцко-русского словаря" на сайте "Онлайн-словари FU-Lab".
  12. Продолжение вычитки варианта на современной орфографии и корректирования в программе LibreOffice Writer удмуртского текста учебника "Н. Н. Баранский. СССР географи. Шор ёзо школаын 6 но 7 араз дышетон книга. Нырысетӥ люкетэз" (1933).
  13. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  14. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2025.01.13.-2025.01.17

опубликовал Öньö Лав в 21:11 19.01.2025

​В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.01.13.-2025.01.17

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer текстов газеты «Коми му» (1991. №№ 6, 7, 8, 14,15) (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  3. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2025. №№1, 2); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926 №№ 17, 18), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  5. Сборка для корпуса текстов нового перевода Библии на коми язык (книги "Олӧм", "Петӧм", "Левит", "Лыд", "Индӧд", Нав Исус", "Ёрдысьяс", "Руфа").
  6. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "Терехова Л. Г, Эрдели В. Г. География. Медодзза тор. Куимӧт велӧтчан во" (1934), "Терехова Л. Г, Эрдели В. Г. География. Мӧдік тор. Нёльӧт класслӧ велӧтчан книга" (1934), "М. Потёмкин да П. Терехов. География. Учӧт грамотаа школаэз понда велӧтчан книга" (1934), "Д-р Ф. А. Копылов. Любознательнӧйезлӧн клуб" (1934), "А. А. Шибанов да мӧд. Природа тӧдмалан книга. Куимӧт во" (1932).
  7. Внесение правок в текст "Коми-пермяцко-русского словаря" на сайте "Онлайн-словари FU-Lab".
  8. Продолжение вычитки варианта на современной орфографии и корректирования в программе LibreOffice Writer удмуртского текста учебника "Н. Н. Баранский. СССР географи. Шор ёзо школаын 6 но 7 араз дышетон книга. Нырысетӥ люкетэз" (1933).
  9. Исправление ошибки в поисковой системе корпуса, связанной с поиском по лемме слов с прописной буквы.
  10. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
     
Яндекс.Метрика