Выль мытшӧдъяс

опубликовал Öньö Лав в 14:45 27.06.2022

Надо восстановить опцию поиска по фольклору в молодцовском, латинском и пермяцком корпусах.

2022ʼ во джынся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 17:48 22.06.2022

=================3. Создание новых продуктов - 3 (в процессе):

1.  Локализация сайтов.
1.1. Сбор материала для локализации муниципальных сайтов и сайтов государственных и муниципальных учреждений по ресурсам МО ГО Сыктывкар,  Сысольского, Усть-Куломского, Ижемского и Печорского районов.
1.2. Перевод с русского языка на коми язык текстов сайтов администраций Сысольского (235887 зн.), Ижемского (143660 зн.), Печорского (39939 зн.) и Усть-Куломского районов (197892 зн.) Республики Коми для коми локализации и корпуса параллельных текстов.

2. Локализация программ.
2.1. Работы по локализации приложений операционной системы Simply Linux.
2.2. Перевод на коми язык глоссария данной ОС, предоставленного разработчиком (2139 строк).

3. Продолжение работы в рамках создания параллельного корпуса (kv-ru) для коми-русского и русско-коми переводчика:
3.1. Создание параллельного корпуса официальных текстов.
3.1.1. Распознавание в программе ABBYY FineReader русскоязычного контента издания "Ведомости нормативных актов органов государственной власти Республики Коми" (1996-1999) для корпуса параллельных текстов. Создание первичных (797 ед.) метаразметок к текстам документов для последующего выравнивания с коми переводами.
3.1.2. Сборка текстов новостной ленты официальных порталов Республики Коми на коми и русском языках за декабрь 2021 – февраль 2022 года; выравнивание коми и русского эквивалента в программе WinMerge. 1350 строк
3.2. Параллельный корпус текстов радионовостей.
3.2.1. Перевод с коми языка на русский текстов в жанре "репортаж" по материалам радио "Коми гор" за 2018 г. (240991 зн.) и 2019 г. (223948 зн.).
3.2.2. Сборка новостных текстов радио "Коми гор" за 2018, 2019 и 2020 гг. и создание метаразметок к текстам.  Выделение в отдельный файл русскоязычного контента  для дальнейшего выравнивания с коми эквивалентом.
3.2.3. Правка новостных текстов радио "Коми гор" за 2017 г., создание метаразметок и разделение массива текстов на параллельные файлы с коми и русскоязычным контентом.
3.2.4. Выработка алгоритма автоматического разделения коми и русского материала в массивах новостных текстов радио "Коми гор".
3.3. Выравнивание коми и русских текстов других форм.
3.3.1. Создание общих файлов tran_ru.txt и tran_kv.txt по собранным в 2021 году параллельным текстам художественной литературы на коми и русском языках, выравнивание строк в текстах указанных файлов в программе WinMerge. 84667 строк.
3.3.2. Создание файлов nt_ru.txt  и nt_kv.txt c текстами Нового завета на коми и русском языках (предварительное устранение нумерации, несовпадающих заголовков и т. п., унификация формата в программе gedit), выравнивание текстов на двух языках в программе WinMerge. 9014 строк.
3.3.3. Сбор русскоязычного материала сайта "Изьватас" и его выравнивание с коми переводом для корпуса параллельных текстов. 1073 строк.
3.3.4. Выравнивание вновь переведенных текстов из учебника географии для 7 класса (2012) с русским оригиналом для корпуса параллельных текстов.

==============4. Пополнение и модернизация существующих электронных ресурсов - 12, в том числе:

1. Текстовое пополнение и оптимизация Корпуса коми языка:

1.1. Сканирование в программе ABBYY FineReader издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (1996 №11, 2002. №№1-5), книг О. И. Уляшев. "Кад пыр верзьӧмӧн" (2019), О. И. Уляшев. "Зарни бобув" (2021), "Долыд олан кад (1997), "Гажӧдчыштам" (2001), "Быдмӧм мывкыдӧн да авъяӧн" (2005), "Тӧдмӧдам челядьӧс вӧр-ваӧн" (2005), "Ӧтисянь дасӧдз" (2000)‎‎, "Вильышпоз" (2000), сборника "Вын" (2022) и двуязчыного фольклорного издания "Шӧвк тупыль" (2012); обработка сканов в программе  ABBYY FineReader и создание pdf файлов.
1.2. Обработка в программе ABBYY FineReader ранее полученных сканов издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2001. №№4-6, 8, 11).
1.3. Распознавание и вычитка в программе  ABBYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка комиязычного контента издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (1996-2001), текстов журналов "Войвыв кодзув"  (1962 №1) и  "Ударник" (1940 №№1-12), газеты "Колхозный труд" (май-сентябрь 1943 года), книг О. И. Уляшев "Зарни бобув" (2021), Е. А. Игушев.  "Коми кывлӧн стилистика" (2003), "Долыд олан кад (1997), "Гажӧдчыштам" (2001), "Быдмӧм мывкыдӧн да авъяӧн" (2005), "Тӧдмӧдам челядьӧс вӧр-ваӧн" (2005), "Ӧтисянь дасӧдз" (2000)‎‎, "Вильышпоз" (2000), и ранее нераспознанных произведений и переводов А. А. Шомысовой из журнала "Арт" и сборника "Медводдза муслун".
1.4. Обработка (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) ранее распознанных текстов: К. Королёв. "Важ нэмъяслӧн гусяторъяс" (2006) и №№2-12 журнала "Войвыв кодзув" за 1962 год;
1.5. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2022. №№1-25), журналов "Войвыв кодзув" (2021 №№10-12, 2022. №№1-5) и "Йӧлӧга" (2021 №12, 2022 №1-5); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
1.6. Распознавание и вычитка в программе ABBYY FineReader диалектных текстов издания "Висер вожса сьыланкывъяс да мойдкывъяс" (1986),  их обработка в программе LibreOffice Writer и создание литературных редакций данных текстов.
1.7. Вычитка и корректирование художественных текстов журнала "Войвыв кодзув" (№№ 7, 8, 11, 12 за 1975 г.),  текстов произведений В. Юхнина (публицистические, литературоведческие и драматические произведения), Е. А. Игушева из изданий "Чужан кыв — менам олӧм да вӧт" (1988) и "Коми кывйыс гажаджык на биысь" (1998).
1.8. Сравнение и корректирование в программе Meld двух редакций романа В. Юхнина "Шувгӧны пожӧмъяс" (1961 и 2007 гг.).
1.9. Обработка текстов новостной ленты официальных порталов Республики Коми на коми языке за декабрь 2021 - февраль 2022 года (метаразметка, проверка текстов на орфографию в программе xed, сбор коми лексического материала для пополнения базы проверки правописания Hunspell).
1.10. Текущие исправления возникающих технических проблем функционирования корпуса.
1.11. Загрузка вновь распознанных и обработанных текстов в корпус коми языка. Обновление корпуса. Объем корпуса на 22.06.2022 - 74 299 530 словоупотреблений.

2. Текстовое пополнение молодцовского корпуса:

2.1. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов)  и добавление в молодцовский корпус текстов 40 комиязычных номеров газеты "Југыԁ туј" за январь-август 1924 г.
2.2. Создание текстовой копии молодцовского издания "Ԍурс ӧкмысԍо кыԅ кыкӧԁ во : комі јӧзлы каԉендар" (1922).
2.3. Регулярное обновление корпуса. Объем корпуса на 22.06.2022 -  1 872 957 словоупотреблений.

3. Создание и пополнение коми-пермяцкого корпуса

3.1. Создание коми-пермяцкого раздела корпуса коми языка на основе текстов оригинальной художественной литературы (1921-2004 гг.).
3.2. Пополнение коми-пермяцкого корпуса текстами еженедельника "Кама кытшын" за 2019-22 гг.,  комиязычных текстов "Югӧр_чукӧр" за 2014-2022 гг., переводов на коми-пермяцкий язык по изданиям 1940-60 гг.,  учебников 1930-40 гг. и готовыми текстами молодцовского и латинского периода на современной графике. Метаразметка текстов.
3.3. Распознавание текста на коми латинице издания "Priroda tədmalan kꞑiga. 5-ət vo" (1932).
3.4. Извлечение из pdf файлов текстов газеты "Кама кытшын" (номера за апрель-сентябрь 2010 г.), первичная обработка текстов в программе xed.
3.5. Регулярное обновление корпуса. Объем на 22.06.2022 -  6 134 914 словоупотреблений.

4. Пополнение онлайн библиотеки "Коми гижӧд":

4.1. Заключение лицензионного договора и размещение в онлайн библиотеке "Коми гижӧд" произведений и переводов А. А. Шомысовой из книг "Дзар" (2011), "Чӧв! (2012), журналов "Войвыв кодзув", "Арт" и коллективных сборников.
4.2. Размещение в онлайн библиотеке текстов произведений В. Юхнина по изданиям "Висьтъяс да очеркъяс" (1961), "Дінъёльса вӧрпункт" (1983), "Герой йылысь сказ" (1945), а также текстов того же автора, опубликованных в журналах "Войвыв кодзув" и "Ударник".
4.3. Размещение в онлайн библиотеке текстов произведений Е. А. Игушева из изданий "Чужан кыв — менам олӧм да вӧт" (1988), "Коми кывйыс гажаджык на биысь" (1998) и "Коми кывлӧн стилистика" (2003).
4.4. Размещение в Коми онлайн библиотеке произведений В. Г. Лодыгина из сборника "Лӧсас" (2013)".
4.5. Размещение в онлайн библиотеке всех текстов комиязычных номеров газеты "Југыԁ туј" за январь-август 1924 года в переводе на современную графику.
4.6. Размещение в коми онлайн библиотеке «Коми гижӧд» (http://komikyv.org) аудиоматериала к текстам произведений коми писателей, предоставленного С. Г. Горчаковой (6-7 класс).
4.7. За отчетный период количество текстов в библиотеке возросло на 1001 единицу.

5. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

5.1. Создание и заполнение информационных wiki-страниц по 10 изданиям: "Дневник Николая Фёдоровича Терентьева" (2021), "Долыд олан кад" (1997), "Ӧтисянь дасӧдз" (2000), "Гажӧдчыштам" (2001), "Быдмӧм мывкыдӧн да авъяӧн" (2005), "Тӧдмӧдам челядьӧс вӧр-ваӧн" (2005),  "Вильышпоз" (2000) , "Вын" (2022) и "Г. Бутырева. Ӧти бипур дорын" (2021), "М. А. Кастрен — Сибир туялысь (2014)"; пополнение библиографии на страницах авторов данных изданий.
5.2. Создание информационных wiki-страниц с содержанием 40 комиязычных номеров газеты "Југыԁ туј" за январь-август 1924 года с добавлением ссылок на тексты статей из этих номеров, размещенные в онлайн-библиотеке "Коми гижӧд".
5.3. Добавление ссылок на произведения, размещенные в онлайн-библиотеке "Коми гижӧд", с wiki-страниц авторов Е. А. Игушев, В. Лодыгин и В. Юхнин, А. Шомысова.
5.3. Создание wiki-страниц по номерам журнала "Ударник" (1940. №1-12) и издания  "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (1996-2002).
5.4. Внесение информации о корректуре на wiki-страницы, посвященных обработанным номерам издания  "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" за 1996-2001 гг. и №№2-12 журнала "Войвыв кодзув" за 1962 год на соответствующих wiki-страницах.
5.7. Добавление изображений на страницы wiki-ресурса "Коми тӧданін", посвященные отдельным изданиям (+10).
5.7. Пополнение таблиц по книжным изданиям на коми языке за 2019-2022 годы и создание ссылок для будущих wiki-страниц по отдельным изданиям на справочном wiki-ресурсе "Коми тӧданін".
5.5. Пополнение библиографии периодики содержанием номеров газеты «Коми му» (2021 г., № 39-52) и журнала «Йӧлӧга» (2021 г., № 9-11).
5.6. Дополнение указателя комиязычных публикаций в журнале "Арт" материалом №№1, 3, 4 за 2020 г.,  №№1-12 за 2021 гг., №№1, 2 за 2022 гг.

6. Пополнение лексической базы FU-Lab:

6.1. Сортировка объединенного списка названий организаций и учреждений, созданного по материалам выполненных заявок БОП за 2012–2021 гг.; обработка общего списка (устранение вновь выявленных повторов, уточнение названий по данным официальных сайтов), создание разметки xml и загрузка "Русско-коми словаря названий организаций и учреждений" (3224 словарные статьи) на сайт Онлайн словари FU-Lab, редактирование онлайн версии словаря, унификация подачи аналогичных случаев.
6.2. Сбор и перевод на коми язык дополнительных названий республиканских и муниципальных учреждений и организаций  Республики Коми, а также названий их отделов и филиалов, не попавших в список, составленный по материалам выполненных заявок БОП за 2012–2021 гг.
6.3. Редактирование новых словарных статей для "Русско-коми словаря названий организаций и учреждений".
6.4. Выработка предложений для Коми РТОК по отдельным проблемам перевода.

7. Пополнение образовательного портала "Коми кыв"

7.1. Размещение на wiki-ресурсе образовательного портала "Коми кыв" текстов методических материалов О. И. Рочевой (6 изданий).
7.2. Сегментация в программе Sound Forge аудиматериала учебников Е. Н. Вязовой и  А. В. Сизовой "Коми кыв" для 3 и 4 классов, привязка аудио к текстам учебника на сайте http://audio.komikyv.ru.
7.3. Создание и обработка (добавление аудиоссылок на имеющийся озвученный материал, создание списка фраз для озвучки) текста онлайн версии разговорника "Сёрнитыштам ёртӧй" (2021) для образовательного портала "Коми кыв", начало работы по добавлению к разговорнику аудиоматериала.
7.4. Пополнение тематических разделов Коми-русского разговорника FU-Lab за счет дополнительных слов и фраз, представленных в «Русско-коми разговорнике» 2021 года.

8. Пополнение лингвистического сайта "Коми кыв"

8.1. Создание и обработка wiki-версии издания "Секреты коми языка" (2020) на wiki-ресурсе "Коми лингвистика".
8.2. Размещение информационных материалов, освящающих события в секторе языка ИЯЛИ ФИЦ "КНЦ УрО РАН".

9. Пополнение образовательного сайта "Коми география":

9.1. Продолжение перевода текста учебника географии для 7 класса (2012),  редактирование новых разделов и их размещение на сайте "Коми мутӧдӧм".

10. Пополнение коми аудиокорпуса:

10.1. Добавление в аудиобазу лаборатории файлов с выпусками радиопередачи "Миян кад" за ноябрь-декабрь 2021 г. и аудиофайлов с художественными текстами, предоставленными С. Г. Горчаковой.

11. Пополнение словарной базы средства проверки правописания Hunspell:

11.1. Сбор новой лексики из коми текстов, обработанных в лаборатории в течение отчетного периода.
11.2. Сортировка и индексация новой лексики, включение ее в коми словарную базу вариативной версии Hunspell.
11.3. Обновление лексической базы коми (вариативного) спелера в Онлайн-сервисе проверки орфографии

12. Добавление олайн-сервисов в раздел "Инструменты" сайта fu-lab.ru

12.1. Добавление сервиса построчного сравнения файлов.
12.2. Добавление сервиса создания tmx-файлов.

 

+Распространение комиязычного контента в соц. сетях.

+Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.


+Участие в мероприятиях:

  1. Участие в мероприятии «Ӧтувъя коми диктант» (2022.02.21).
  2. Выступление на межрегиональной научно-практической онлайн конференции "Диалог культур — ценность гражданско-патриотического воспитания". (Пермь-Кудымкар-Кочево, 17.02.2022) с информацией о комплексе комиязчычных онлайн ресурсов и перспективах его расширения за счет коми-пермяцкого материала.
  3. Участие в работе круглого стола "К 30-летию Закона Республики Коми "О государственных языках Республики Коми" (ГОУ ВО КРАГСиУ, 2022.04.22).
  4. Участие в  zoom-конференции "Роль языковых активистов и сообществ в сохранении языков" (2022.05.03).
  5. Онлайн участие двух сотрудников в мероприятии: "Весенняя школа по сохранению, развитию и возрождению языков" (22–24 апреля 2022 г., Институт языкознания РАН, Москва).
  6. Участие и выступление на научно-популярном форуме "Коми-пермяцкий язык. Прошедшее, настоящее и будущее время" (Кудымкар, 2002.05.17).
  7. Проведение пяти вебинаров в Коми республиканском институте развития образования:
    • "Порядок установки и особенности функционирования коми раскладкок клавиатуры" (2022.01.27)
    • "Особенности функционирования и возможностями использования онлайн библиотеки "Коми гижӧд" (2022.03.16).
    • "Использование образовательного портала "Коми кыв" в процессе обучения коми языку" (2022.03.17).
    • "Автоматическая проверка правописания в процессе обучения коми языку" (2022.04.15)
    • "Справочник по коми письменности «Коми тӧданін» в процессе обучения коми языку" (2022.06.-23).
2022ʼ мӧд квартался отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 11:41 22.06.2022

2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:

2.1. Перевод с русского языка на коми язык текстов сайтов администраций Сысольского, Ижемского и Усть-Куломского районов Республики Коми для коми локализации и корпуса параллельных текстов.
2.2. Распознавание в программе ABBYY FineReader русскоязычного контента издания "Ведомости нормативных актов органов государственной власти Республики Коми" (1996-1999) для корпуса параллельных текстов. Создание первичных метаразметок к текстам документов для последующего выравнивания с коми переводами.
2.3. Выравнивание вновь переведенных текстов из учебника географии для 7 класса (2012) с русским оригиналом для корпуса параллельных текстов.
2.4. Работы по локализации приложений операционной системы Simply Linux, перевод на коми язык глоссария данной ОС, предоставленного разработчиком.
2.5. Продолжение перевода с коми языка на русский текстов в жанре "репортаж" по материалам радио "Коми гор" за 2018 и 2019 гг.
2.6. Сборка новостных текстов радио "Коми гор" за 2020 г. и создание метаразметок к текстам.  Выделение в отдельный файл русскоязычного контента  для дальнейшего выравнивания с коми эквивалентом.
2.7. Правка новостных текстов радио "Коми гор" за 2017 г., создание метаразметок и разделение массива текстов на параллельные файлы с коми и русскоязычным контентом.   
2.8. Выработка алгоритма автоматического разделения коми и русского материала в массивах новостных текстов радио "Коми гор".

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Сканирование в программе ABBYY FineReader издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (1996 №11, 2002. №№1-5), сборника "Вын" (2022) и двуязчыного фольклорного издания "Шӧвк тупыль" (2012); обработка сканов в программе  ABBYY FineReader и создание pdf файлов.
3.2. Обработка в программе ABBYY FineReader ранее полученных сканов издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2001. №№4-6, 8, 11).
3.3. Распознавание и вычитка в программе  ABBYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка комиязычного контента издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (1996-2001),  текстов журналов "Войвыв кодзув"  (1962 №1) и  "Ударник" 1940 (№№2-7, 10-12), газеты "Колхозный труд" (май-сентябрь 1943 года) и ранее нераспознанных произведений и переводов А. А. Шомысовой из журнала "Арт" и сборника "Медводдза муслун".
3.4. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2022. №№13-25), журналов "Войвыв кодзув" (2021 №№10-12, 2022. №№15) и "Йӧлӧга" (2022. №№2-5); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
3.5. Распознавание и вычитка в программе ABBYY FineReader диалектных текстов издания "Висер вожса сьыланкывъяс да мойдкывъяс" (1986),  их обработка в программе LibreOffice Writer и создание литературных редакций данных текстов.
3.6. Загрузка вновь распознанных и обработанных текстов в корпус коми языка. Обновление корпуса.
3.7. Текущие исправления возникающих технических проблем функционирования корпуса.

4. Текстовое пополнение молодцовского корпуса:

4.1. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов)  и добавление в молодцовский корпус текстов комиязычных номеров газеты "Југыԁ туј" за 1924-05-01, 1924-05-05, 1924-05-09, 1924-05-14, 1924-05-21,1924-05-24, 1924-05-30, 1924-06-07, 1924-06-20, 1924-06-25, 1924-07-02, 1924-07-05, 1924-07-19,  1924-07-23, 1924-07-26, 1924-07-30, 1924-08-06, 1924-08-09, 1924-08-13, 1924-08-16 и 1924-08-20.
4.2. Создание текстовой копии молодцовского издания "Ԍурс ӧкмысԍо кыԅ кыкӧԁ во : комі јӧзлы каԉендар" (1922).

5. Работа над пополнением коми-пермяцкого корпуса

5.1. Извлечение из pdf файлов текстов газеты "Кама кытшын" (номера за апрель-сентябрь 2010 г.), первичная обработка текстов в программе xed.
5.2. Добавление в коми-пермяцкий корпус текстов газеты "Кама кытшын" за февраль-апрель 2022 гг. и комиязычных текстов "Югӧр_чукӧр" за 2014-2022 гг.
5.3. Пополнение коми-пермяцкого корпуса интернет-контентом за апрель-июнь 2022 г.

6. Пополнение онлайн библиотеки "Коми гижӧд":

6.1. Заключение лицензионного договора и размещение в онлайн библиотеке "Коми гижӧд" произведений и переводов А. А. Шомысовой из книг "Дзар" (2011), "Чӧв! (2012), журналов "Войвыв кодзув", "Арт" и коллективных сборников. (Всего 221 произведение).
6.2. Размещение в Коми онлайн библиотеке  116 произведений В. Г. Лодыгина из сборника "Лӧсас" (2013)".
6.3. Размещение в Коми онлайн библиотеке "Коми гижӧд" в переводе на современную графику текстов комиязычных номеров газеты "Југыԁ туј" за 1924-05-01, 1924-05-05, 1924-05-09, 1924-05-14, 1924-05-21,1924-05-24, 1924-05-30, 1924-06-07, 1924-06-20, 1924-06-25, 1924-07-02, 1924-07-05, 1924-07-19,  1924-07-23, 1924-07-26, 1924-07-30, 1924-08-06, 1924-08-09, 1924-08-13, 1924-08-16 и 1924-08-20.

7. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

7.1. Создание и заполнение wiki-страниц по отдельным номерам газеты "Југыԁ туј" за 1924-05-01, 1924-05-05, 1924-05-09, 1924-05-14, 1924-05-21,1924-05-24, 1924-05-30, 1924-06-07, 1924-06-20, 1924-06-25, 1924-07-02, 1924-07-05, 1924-07-19,  1924-07-23, 1924-07-26, 1924-07-30, 1924-08-06, 1924-08-09, 1924-08-13, 1924-08-16 и 1924-08-20 и журнала "Войвыв кодзув" (1961. №1; 2021. №10-12; 2022. №№1-5).
7.2. Создание и заполнение wiki-страницы по книжному изданию  "М. А. Кастрен — Сибир туялысь (2014)".
7.3. Создание wiki-страниц по номерам журнала "Ударник" (1940. №1-12) и издания  "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (1996-2002).
7.4. Отметки об исправлениях в обработанных номерах издания  "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" за 1996-2001 гг. на соответствующих wiki-страницах.
7.5. Создание ссылок на тексты, размещенные в онлайн библиотеке "Коми гижӧд", со страниц авторов "Лодыгин Василий" и "Шомысова Алёна", а также соответствующих изданий.
7.6. Дополнение указателя коми публикаций в журнале "Арт" материалом №№1, 2 за 2022 гг.
7.7. Пополнение таблиц по книжным изданиям на коми языке за 2019-2022 годы и создание ссылок для будущих wiki-страниц по отдельным изданиям на справочном wiki-ресурсе "Коми тӧданін".

8. Пополнение сайта "Коми география":

8.1. Продолжение перевода текста учебника географии для 7 класса (2012), его редактирование и размещение на сайте "Коми мутӧдӧм".

9. Участие в мероприятиях:

9.1. Участие в работе круглого стола "К 30-летию Закона Республики Коми "О государственных языках Республики Коми" (ГОУ ВО КРАГСиУ).
9.2. Участие в  zoom-конференции "Роль языковых активистов и сообществ в сохранении языков" (2022.05.03).
9.3. Онлайн участие двух сотрудников в мероприятии: "Весенняя школа по сохранению, развитию и возрождению языков" (22–24 апреля 2022 г., Институт языкознания РАН, Москва).
9.4. Участие и выступление на научно-популярном форуме "Коми-пермяцкий язык. Прошедшее, настоящее и будущее время" (Кудымкар, 2002.05.17).
9.5. Проведение вебинаров в Коми республиканском институте развития образование на тему "Автоматическая проверка правописания в процессе обучения коми языку" (2022-04-15) и "Справочник по коми письменности «Коми тӧданін» в процессе обучения коми языку" (2022-06-23).

10. Пополнение словарной базы средства проверки правописания Hunspell:

10.1. Сбор новой лексики из коми текстов, обработанных в лаборатории в течение месяца.
10.2. Сортировка и индексация новой лексики, включение ее в коми словарную базу вариативной версии Hunspell.

11. Добавление олайн-сервисов в раздел "Инструменты" сайта fu-lab.ru

11.1. Добавление сервиса построчного сравнения файлов.
11.2. Добавление сервиса создания tmx-файлов.

12. Распространение комиязычного контента в соц. сетях.

13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

2022ʼ лӧддза-номъя тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 18:09 21.06.2022

2022.05.23 – 2022.06.24


2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:

2.1. Продолжение перевода с русского языка на коми язык текстов сайтов администраций Сысольского, Ижемского и Усть-Куломского районов Республики Коми для коми локализации и корпуса параллельных текстов.

2.2. Распознавание в программе ABBYY FineReader русских текстов издания "Ведомости нормативных актов органов государственной власти Республики Коми" (1999. №№1-12) для корпуса параллельных текстов. Создание первичных метаразметок к текстам документов для последующего выравнивания с коми переводами.

2.3. Перевод трех параграфов учебника по географии для 7 класса (2012), редактирование перевода, размещение коми текстов на сайте "Коми мутӧдӧм", выравнивание коми перевода с оригиналом для корпуса параллельных текстов.

2.4. Продолжение работы над локализацией приложений операционной системы Simply Linux, перевод на коми язык глоссария данной ОС, предоставленного разработчиком.

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2022. №№21-25), журналов "Войвыв кодзув" (2022. №№4, 5) и "Йӧлӧга" (2022. №№4, 5); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).

3.2. Распознавание и вычитка в программе  ABBYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) комиязычного контента издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2001. №№1-12).

3.3. Распознавание и вычитка в программе ABBYY FineReader комиязычного контента издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2002. №№ 1-2), текстов газеты "Колхозный труд" за май-сентябрь 1943 года и ранее нераспознанных произведений и переводов А. А. Шомысовой из журнала "Арт" и сборника "Медводдза муслун".

3.4. Распознавание и вычитка в программе ABBYY FineReader диалектных текстов издания "Висер вожса сьыланкывъяс да мойдкывъяс" (1986),  их обработка в программе LibreOffice Writer и создание литературных редакций данных текстов.

3.5. Сканирование в программе ABBYY FineReader издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2002. №№1-5) и двуязчыного фольклорного издания "Шӧвк тупыль" (2012); обработка сканов в программе  ABBYY FineReader и создание pdf файлов.

3.6. Загрузка вновь распознанных и обработанных текстов в корпус коми языка. Обновление корпуса.

4. Текстовое пополнение молодцовского корпуса:

4.1. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов)  и добавление в молодцовский корпус текстов комиязычных номеров газеты "Југыԁ туј" за 1924-07-05, 1924-07-19,  1924-07-23, 1924-07-26, 1924-07-30, 1924-08-06, 1924-08-09, 1924-08-13, 1924-08-16 и 1924-08-20.

4.1. Создание текстовой копии молодцовского издания "Ԍурс ӧкмысԍо кыԅ кыкӧԁ во : комі јӧзлы каԉендар" (1922).

5. Работа над пополнением коми-пермяцкого корпуса

5.1. Пополнение коми-пермяцкого корпуса интернет-контентом за май-июнь 2022 г.

6. Пополнение онлайн библиотеки "Коми гижӧд":

6.1. Заключение лицензионного договора и размещение в онлайн библиотеке "Коми гижӧд" произведений и переводов А. А. Шомысовой из книг "Дзар" (2011), "Чӧв! (2012), журналов "Войвыв кодзув", "Арт" и коллективных сборников. (Всего 221 произведение).

6.2. Размещение в Коми онлайн библиотеке  75 произведений В. Г. Лодыгина из сборника "Лӧсас" (2013)".

6.3. Размещение в Коми онлайн библиотеке "Коми гижӧд" в переводе на современную графику текстов комиязычных номеров газеты "Југыԁ туј" за 1924-07-05, 1924-07-19,  1924-07-23, 1924-07-26, 1924-07-30, 1924-08-06, 1924-08-09, 1924-08-13, 1924-08-16 и 1924-08-20.

7. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

7.1. Заполнение wiki-страниц по отдельным номерам газеты "Југыԁ туј" за 1924-07-05, 1924-07-19,  1924-07-23, 1924-07-26, 1924-07-30, 1924-08-06, 1924-08-09, 1924-08-13, 1924-08-16 и 1924-08-20 и  журнала "Войвыв кодзув" (2022 №4-5).

7.2. Отметки об исправлениях в обработанных номерах издания  "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" за 2001 г. на соответствующих wiki-страницах.

7.3. Создание ссылок на тексты, размещенные в онлайн библиотеке "Коми гижӧд", со страниц авторов "Лодыгин Василий" и "Шомысова Алена", а также соответствующих изданий.

7.4. Дополнение указателя коми публикаций в журнале "Арт" материалом №№1, 2 за 2022 гг.

8. Участие в мероприятиях:

8.1. Проведение вебинара в Коми республиканском институте развития образование на тему "Справочник по коми письменности «Коми тӧданін» в процессе обучения коми языку" (2022-06-23).

9. Пополнение словарной базы средства проверки правописания Hunspell:

9.1. Сбор новой лексики из коми текстов, обработанных в лаборатории в течение месяца.

9.2. Сортировка и индексация новой лексики, включение ее в коми словарную базу вариативной версии Hunspell.

10. Распространение комиязычного контента в соц. сетях.

11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

 

FU-Lab 2022.06.20-2022.06.24

опубликовал Öньö Лав в 16:53 21.06.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.06.20-2022.06.24

 

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов сайтов администраций Сысольского, Ижемского и Усть-Куломского районов Республики Коми для коми локализации и корпуса параллельных текстов.
  3. Продолжение работы над локализацией приложений операционной системы Simply Linux, перевод на коми язык глоссария данной ОС, предоставленного разработчиком.
  4. Перевод трех параграфов учебника по географии для 7 класса (2012), редактирование перевода, размещение коми текстов на сайте "Коми мутӧдӧм", выравнивание коми перевода с оригиналом для корпуса параллельных текстов.
  5. Сканирование издания "Шӧвк тупыль" (2012), обработка сканов в программе  ABBYY FineReader и создание pdf файла.
  6. Продолжение создания литературных редакций текстов издания "Висер вожса сьыланкывъяс да мойдкывъяс" (1986).
  7. Создание текстовой копии молодцовского издания "Ԍурс ӧкмысԍо кыԅ кыкӧԁ во : комі јӧзлы каԉендар" (1922).
  8. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2022 №25) и журнала "Йӧлӧга" (2022. №№4, 5), их обработка  в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и добавление в корпус коми языка.
  9. Создание в базе корпуса коми языка раздела "Диалектные тексты", загрузка в него оригинальных текстов издания "Висер вожса сьыланкывъяс да мойдкывъяс" (1986).
  10. Пополнение коми-пермяцкого корпуса интернет-контентом за май-июнь 2022 г.
  11. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов комиязычных номеров газеты "Југыԁ туј" за 1924-08-16 и 1924-08-20, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение страниц с оглавлением по данным номерам в справочном wiki-ресурсе "Коми тӧданін".
  12. Размещение в онлайн библиотеке "Коми гижӧд" 75 произведений В. Г. Лодыгина из сборника "Лӧсас" (2013), создание ссылок на размещенные тексты со страниц автора и изданий на wiki-ресурсе "Коми тӧданін".
  13. Дополнение указателя публикаций в журнале "Арт" материалом №№1, 2 за 2022 г.
  14. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  15. Распространение комиязычного контента в соц. сетях.
  16. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.06.13-2022.06.17

опубликовал Öньö Лав в 18:39 16.06.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.06.13-2022.06.17

 

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов сайтов администраций Сысольского, Ижемского и Усть-Куломского районов Республики Коми для коми локализации и корпуса параллельных текстов.
  3. Распознавание в программе ABBYY FineReader русских текстов издания "Ведомости нормативных актов органов государственной власти Республики Коми" (1999. №№1-12) для корпуса параллельных текстов. Создание первичных метаразметок к текстам документов
  4. Распознавание и вычитка в программе ABBYY FineReader текстов произведений из журнала "Арт", переведенных на коми язык А. А. Шомысовой.
  5. Размещение в онлайн библиотеке "Коми гижӧд" переводных стихотворений и рассказов А. А. Шомысовой из журналов "Войвыв кодзув", "Арт" и сборников "Няньӧн-солӧн", "Льӧм ю", создание ссылок на размещенные тексты со страниц автора и изданий на wiki-ресурсе "Коми тӧданін".
  6. Продолжение создания литературных редакций текстов издания "Висер вожса сьыланкывъяс да мойдкывъяс" (1986).
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов комиязычных номеров газеты "Југыԁ туј" за 1924-08-06, 1924-08-09 и 1924-08-13, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд"; создание и заполнение страниц с оглавлением по данным номерам в справочном wiki-ресурсе "Коми тӧданін".
  8. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2022 №24), обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  9. Добавление в корпус коми языка текстов №№21-24 газеты "Коми му" и №№4-5 журнала "Войвыв кодзув" за 2022 год, текстов издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2001. №№3-12), обновление корпуса.
  10. Пополнение молодцовского корпуса текстами комиязычных номеров газеты "Југыԁ туј" за 1924-07-05, 1924-07-19,  1924-07-23, 1924-07-26, 1924-07-30, 1924-08-06, 1924-08-09 и 1924-08-13.
  11. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.06.06-2022.06.10

опубликовал Öньö Лав в 20:57 09.06.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.06.06-2022.06.10
    

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов сайтов администраций Сысольского и Усть-Куломского районов Республики Коми для коми локализации и корпуса параллельных текстов.
  3. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2022 №23) и журнала "Войвыв кодзув" (2022. №№4-5), обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов); по номерам журнала заполнены страницы в справочном wiki-ресурсе "Коми тӧданін".
  4.  Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов комиязычных номеров газеты "Југыԁ туј" за 1924-07-26 и 1924-07-30, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд"; создание и заполнение страниц с оглавлением по данным номерам в справочном wiki-ресурсе "Коми тӧданін".
  5.  Распознавание и вычитка в программе ABBYY FineReader диалектных текстов издания "Висер вожса сьыланкывъяс да мойдкывъяс" (1986),  их обработка в программе LibreOffice Writer и создание литературных редакций данных текстов.
  6. Распространение комиязычного контента в соц. сетях.
FU-Lab 2022.05.30-2022.06.03

опубликовал Öньö Лав в 11:59 02.06.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.05.30-2022.06.03

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов сайта администрации Сысольского района для коми локализации и корпуса параллельных текстов.
  3. Сканирование и обработка сканов в программе ABBYY FineReader издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2002. №№1-5), создание pdf копий указанных номеров.
  4. Обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) комиязычного текста издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2001. №№9-12). Отметки об исправлениях в данных текстах сделаны на соответствующих страницах справочного wiki-ресурса "Коми тӧданін".
  5. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2022. №22) и их обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  6. Распознавание в программе ABBYY FineReader молодцовских текстов комиязычного номера газеты "Југыԁ туј" за 1924-07-23, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд"; создание и заполнение страниц с оглавлением по данному номеру в справочном wiki-ресурсе "Коми тӧданін".
  7. Распознавание и вычитка в программе ABBYY FineReader комиязычных текстов издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2002. №№ 1-2), текстов газеты "Колхозный труд" за май-сентябрь 1943 года и ранее нераспознанных произведений А. А. Шомысовой из журнала "Арт" и сборника "Медводдза муслун"
  8. Размещение в онлайн библиотеке "Коми гижӧд" произведений А. А. Шомысовой из книг "Дзар" (2011), "Чӧв! (2012), журналов "Войвыв кодзув", "Арт" и коллективных сборников; создание ссылок на размещенные тексты со страниц автора и издания на wiki-ресурсе "Коми тӧданін".
  9. Распространение комиязычного контента в соц. сетях.
FU-Lab 2022.05.23-2022.05.27

опубликовал Öньö Лав в 23:03 26.05.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.05.23-2022.05.27

 

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов сайтов администраций Сысольского и Усть-Куломского районов для коми локализации и корпуса параллельных текстов.
  3. Распознавание и вычитка в программе ABBYY FineReader комиязычных текстов издания "Ведомости нормативных актов органов государственной власти Республики Коми" (2001, №№ 8-10, 12).
  4. Обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) комиязычного текста издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2001. №№3-8). Отметки об исправлениях в данных текстах сделаны на соответствующих страницах справочного wiki-ресурса "Коми тӧданін".
  5. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2022. №21) и их обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  6. Распознавание в программе ABBYY FineReader молодцовских текстов комиязычных номеров газеты "Југыԁ туј" за 1924-07-05 и 1924-07-19, их обработка в программе LibreOffice и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд"; создание и заполнение страниц с оглавлением по данным номерам в справочном wiki-ресурсе "Коми тӧданін".
  7. Заключение лицензионного договора с автором на размещение в онлайн библиотеке "Коми гижӧд" произведений А. А. Шомысовой (Старцевой).
  8. Распространение комиязычного контента в соц. сетях.
2022ʼ ода-кора тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 17:41 20.05.2022

2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:

2.1. Продолжение перевода с коми языка на русский текстов в жанре "репортаж" по материалам радио "Коми гор" за 2019 гг.

2.2. Выработка алгоритма автоматического разделения коми и русского материала в массивах новостных текстов радио "Коми гор".

2.3. Продолжение перевода на коми язык текстов сайтов администраций Сысольского и Усть-Куломского районов для коми локализации и корпуса параллельных текстов.

2.4. Распознавание и обработка в программе ABBYY FineReader русских текстов издания "Ведомости нормативных актов органов государственной власти Республики Коми" (1996. №№1-12; 1997. №№1-12; 1998. №№1-12). Создание первичных метаразметок к текстам документов для последующего выравнивания с коми переводами.

2.5. Начало работы над локализацией приложений операционной системы Simply Linux.

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2022. №№17-20), обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.

3.2. Обработка в программе ABBYY FineReader ранее полученных сканов издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2001. №№8, 11).

3.3. Распознавание и вычитка в программе  ABBYY FineReader коми текстов издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (1996. №№7-8, 11-12; 1998. №№1-12, 1999. №№1-12, 2000. №№1-12, 2001 №№3-7, 11).

3.4. Обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) комиязычного текста издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (1996. №№1-8, 11-12, 1997. №№1-12;1998. №№1-12;1999. №№1-12, 2000. №№1-12).

3.5. Загрузка вновь распознанных и обработанных текстов в корпус коми языка. Еженедельное обновление корпуса.

4. Текстовое пополнение молодцовского корпуса:

4.1. Добавление в молодцовский корпус текстов комиязычных номеров газеты "Југыԁ туј" за 1924-05-30, 1924-06-07, 1924-06-20, 1924-06-25 и 1924-07-02.

5. Работа над пополнением коми-пермяцкого корпуса

5.1. Извлечение из pdf файлов текстов газеты "Кама кытшын" (номера за апрель-сентябрь 2010 г.), первичная обработка текстов в программе xed.

5.2. Пополнение коми-пермяцкого корпуса интернет-контентом за апрель-май 2022 г.

6. Пополнение онлайн библиотеки "Коми гижӧд":

6.1. Размещение в Коми онлайн библиотеке "Коми гижӧд" в переводе на современную графику текстов комиязычных номеров газеты "Југыԁ туј" за 1924-05-30, 1924-06-07, 1924-06-20, 1924-06-25 и 1924-07-02.

6.2. Размещение в Коми онлайн библиотеке  41 произведения В. Г. Лодыгина из сборника "Лӧсас" (2013)".

7. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

7.1. Заполнение wiki-страниц по отдельным номерам газеты "Југыԁ туј" за 1924-05-30, 1924-06-07, 1924-06-20, 1924-06-25 и 1924-07-02.

7.2. Отметки об исправлениях в обработанных номерах издания  "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" за 1996-2000 гг. на соответствующих wiki-страницах.

7.3. Создание ссылок на тексты, размещенные в онлайн библиотеке "Коми гижӧд", со страниц автора "В. Г. Лодыгин" и издания "Лӧсас (2013)".

7.4. Пополнение таблиц по книжным изданиям на коми языке за 2019-2022 годы и создание ссылок для будущих wiki-страниц по отдельным изданиям на справочном wiki-ресурсе "Коми тӧданін".

7.5. Создание и заполнение wiki-страницы по книжному изданию  "М. А. Кастрен — Сибир туялысь (2014)".

8. Участие в мероприятиях:

8.1. Участие в работе круглого стола "К 30-летию Закона Республики Коми "О государственных языках Республики Коми" (ГОУ ВО КРАГСиУ).

8.2. Участие в  zoom-конференции "Роль языковых активистов и сообществ в сохранении языков" (2022.05.03).

8.3. Участие и выступление на научно-популярном форуме "Коми-пермяцкий язык. Прошедшее, настоящее и будущее время" (Кудымкар, 2002.05.17).

9. Пополнение словарной базы средства проверки правописания Hunspell:

9.1. Сбор новой лексики из коми текстов, обработанных в лаборатории в течение месяца.

9.2. Сортировка и индексация новой лексики, включение ее в коми словарную базу вариативной версии Hunspell.

10. Распространение комиязычного контента в соц. сетях.

11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

FU-Lab 2022.05.16-2022.05.20

опубликовал Öньö Лав в 19:19 19.05.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.05.16-2022.05.20.

 

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов сайтов администраций Сысольского и Усть-Куломского районов для коми локализации и корпуса параллельных текстов.
  3. Распознавание в программе ABBYY FineReader русскоязычных текстов издания "Ведомости нормативных актов органов государственной власти Республики Коми" (1996. №№1-12; 1997. №№1-12; 1998. №№1-12) для дальнейшего выравнивания с коми переводом. Создание первичных метаразметок к текстам документов
  4. Распознавание и вычитка в программе ABBYY FineReader комиязычных текстов издания "Ведомости нормативных актов органов государственной власти Республики Коми" (2001, №№3-7, 11).
  5. Обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) комиязычного текста издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2000. №№6-12). Отметки об исправлениях в данных текстах сделаны на соответствующих страницах справочного wiki-ресурса "Коми тӧданін".
  6. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2022. №20) и их обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  7. Загрузка в корпус коми языка обработанных коми текстов издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2000. №№1-12) и газеты "Коми му" (2022. №20); обновление корпуса.
  8. Добавление в молодцовский корпус текстов комиязычного номера газеты "Југыԁ туј" за 1924-07-02, их размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд"; создание и заполнение страниц с оглавлением по данному номеру в справочном wiki-ресурсе "Коми тӧданін".
  9. Извлечение из pdf файлов комиязчыных текстов  газеты "Кама кытшын"  (номера за январь-сентябрь 2010 г.), первичная обработка текстов в программе xed.
  10. Пополнение коми-пермяцкого корпуса интернет-контентом за апрель-май 2022 г.
  11. Начало работы над локализацией приложений операционной системы Simply Linux.
  12. Оптимизация алгоритма автоматического разделения коми и русского материала в массивах новостных текстов радио "Коми гор".
  13. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  14. Распространение комиязычного контента в соц. сетях.
  15. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  16. Участие в научно-популярном форуме "Коми-пермяцкий язык. Прошедшее, настоящее и будущее время" (Кудымкар, 17 мая 2022 г.), онлайн выступление на тему "Коми-пермяцкий раздел корпуса коми языка — возможности использования и пути развития.".
FU-Lab 2022.05.11-2022.05.13

опубликовал Öньö Лав в 21:02 12.05.2022

 В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.05.11-2022.05.13.

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов сайта администрации Сысольского района для коми локализации и корпуса параллельных текстов.
  3. Завершение перевода с коми языка на русский текстов в жанре "репортаж" по материалам радио "Коми гор" за 2019 г.
  4. Выработка алгоритма автоматического разделения коми и русского материала в массивах новостных текстов радио "Коми гор".
  5. Распознавание в программе ABBYY FineReader коми текстов издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2000. №№4-12).
  6. Обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) комиязычных текстов издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (1999. №№1-12) и их добавление в корпус коми языка. Отметки об исправлениях в данных текстах сделаны на соотвествующих страницах справочного wiki-ресурса "Коми тӧданін".
  7. Обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, расстановка языковых тэгов) комиязычных текстов издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2000. №№1-5).
  8. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2022 №19), их обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и добавление в корпус коми языка.
  9. Добавление в молодцовский корпус текстов комиязычного номера газеты "Југыԁ туј" за 1924-06-25, их размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд"; создание и заполнение страниц с оглавлением по данным номерам в справочном wiki-ресурсе "Коми тӧданін".
  10. Размещение 31 стихотворения В.Лодыгина из сборника "Лӧсас" (2013)" в онлайн библиотеке "Коми гижӧд", создание ссылок на размещенные тексты со страниц автора и издания на wiki-ресурсе "Коми тӧданін".
  11. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по книжному изданию на коми языке: "М. А. Кастрен — Сибир туляысь (2014)".
  12. Пополнение таблиц по книжным изданиям на коми языке за 2019-2022 годы и создание ссылок для будущих wiki-страниц по отдельным изданиям на справочном wiki-ресурсе "Коми тӧданін".
  13. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  14. Распространение комиязычного контента в соц. сетях.
  15. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.05.04-2022.05.06

опубликовал Öньö Лав в 20:54 05.05.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.05.04-2022.05.06.

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов сайта администрации Сысольского района для коми локализации и корпуса параллельных текстов.
  3. Продолжение перевода с коми языка на русский текстов в жанре "репортаж" по материалам радио "Коми гор" за 2019 г.
  4. Распознавание в программе ABBYY FineReader коми текстов издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (1999. №№1-12, 2000 №№1-3).
  5. Обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) комиязычных текстов издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (1998. №№1-12) и их добавление в корпус коми языка. Отметки об исправлениях в данных текстах сделаны на соотвествующих страницах справочного wiki-ресурса "Коми тӧданін".
  6. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2022 №18), их обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и добавление в корпус коми языка.
  7. Дополнение функции разбивки по маркеру в позиции после двоеточия и точки с запятой в корпусе коми языка, обновление корпуса.
  8. Добавление в молодцовский корпус текстов комиязычных номеров газеты "Југыԁ туј" за 1924-06-07 и 1924-06-20, их размещение в переводе на современную графику в Коми онлайн библиотеке "Коми гижӧд"; создание и заполнение страниц с оглавлением по данным номерам в справочном wiki-ресурсе "Коми тӧданін".
  9. Формулировка основных направлений деятельности межрегиональной лаборатории FU-Lab по коми языку в рамках реализации Международного десятилетия языков коренных народов мира.
  10. Участие в zoom-конференции "Роль языковых активистов и сообществ в сохранении языков" (2022.05.03).
  11. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.04.25-2022.04.29

опубликовал Öньö Лав в 21:18 28.04.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.04.25-2022.04.29.

 

  1.  
  2. Продолжение перевода на коми язык текстов сайта администрации Сысольского района для коми локализации и корпуса параллельных текстов
  3. Дальнейший перевод с коми языка на русский текстов в жанре "репортаж" по материалам радио "Коми гор" за 2019 г. для корпуса параллельных текстов.
  4. Распознавание коми текстов журнала "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (1996. №№7-8, 11-12, 1998. №№1-12).
  5. Обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) комиязычного текста издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (1996. №№1-8, 11-12, 1997. №№1-12). Отметки об исправлениях в этих номерах на соотвествующих страницах справочного wiki-ресурса "Коми тӧданін".
  6. Обработка в программе AbbyyFineReader ранее полученных сканов издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2001. №№8, 11);  дополнительное сканирование страниц взамен дефектных сканов.
  7. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2022 №16), обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  8. Размещение стихотворений В.Лодыгина из сборника "Лӧсас" (2013)" в онлайн библиотеке "Коми гижӧд": "Морӧс бердас видзьяс..."; "Радейтӧм"; "Купайтчысь нывбаба" (2013); "Тэ и менам гажыс"; "Да, вӧлі чуймӧдана здук..."; "Курыд жов пу"; "Оз (Дзик на еджыдӧн озйыс тыдалӧ...)"; "Видзьяс вежӧсь, кыдзьяс вежӧсь..."; "Визув юӧд — Кӧтйӧмӧд..."; "Борйысь борйӧ лэбалӧ...". Создание ссылок на размещенные произведения с wiki-страниц писателя и издания  справочного wiki-ресурса "Коми тӧданін".
  9. Добавление в корпус коми языка текстов газеты "Коми му" (2021. №16), издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (1996. №№1-8, 11-12, 1997 №№1-12).
  10. Подключение к корпусу коми языка базы интегрального словаря.
  11. Добавление в молодцовский корпус текстов комиязычного номера газеты "Југыԁ туј" за 1924-05-30, их размещение в переводе на современную графику в Коми онлайн библиотеке "Коми гижӧд".
  12. Участие в круглом столе «К 30-летию Закона Республики Коми «О государственных языках Республики Коми» в ГОУ ВО КРАГСиУ.
  13. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  14. Распространение комиязычного контента в соц. сетях.
  15. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2022ʼ косму тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 15:58 22.04.2022

 

2. Сбор, создание и обработка параллельных текстов (пара коми-русский) в рамках создания параллельного корпуса (kv-ru) и локализации сайтов:

2.1. Продолжение перевода с коми языка на русский текстов в жанре "репортаж" по материалам радио "Коми гор" за 2018 и 2019 гг.

2.2. Сборка новостных текстов радио "Коми гор" за 2020 г. и создание метаразметок к текстам.  Выдление в отдельный файл русскоязычного контента  для дальнейшего выравнивания с коми эквивалентом.

2.3. Правка новостных текстов радио "Коми гор" за 2017 г., создание метаразметок и разделение массива текстов на параллельные файлы с коми и русскоязычным контентом.    

2.4. Начало перевода на коми язык текстов сайта администрации Сысольского района для коми локализации и корпуса параллельных текстов.

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2022 №№13-16), журналов "Йӧлӧга" (2022. №№2, 3) и "Войвыв кодзув" (2021 №№10-12, 2022. №№1-3), обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.

3.2. Распознавание в программе ABBYY FineReader, обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка  текстов журнала "Ударник" 1940 (№№2-7, 10-12).

3.3. Обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка комиязычного текста издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (1996. №10, 2021. №№1-2) и журнала "Войвыв кодзув" (1962 №1).

3.4. Распознавание в программе  ABBYY FineReader коми текстов издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (1996. №№1-6, 10; 1997. №№1-12).

3.5. Сканирование, обработка  сканов в программе ABBYY FineReader и создание pdf версий сборника "Вын" (2022) и №11 издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" за 1996 год.

3.6. Обработка в программе ABBYY FineReader ранее полученных сканов издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (2001. №№4-6).

4. Текстовое пополнение и оптимизация молодцовского корпуса:

4.1. Добавление в молодцовский корпус текстов комиязычных номеров газеты "Југыԁ туј" за 1924-05-01, 1924-05-05, 1924-05-09, 1924-05-14, 1924-05-21 и 1924-05-24.

5. Работа над пополнением коми-пермяцкого корпуса

5.1. Добавление в коми-пермяцкий корпус текстов газеты "Кама кытшын" за февраль-апрель 2022 гг. и комиязычных текстов "Югӧр_чукӧр" за 2014-2022 гг.

6. Пополнение онлайн библиотеки "Коми гижӧд":

6.1. Размещение в Коми онлайн библиотеке "Коми гижӧд" в переводе на современную графику текстов комиязычных номеров газеты "Југыԁ туј" за 1924-05-01, 1924-05-05, 1924-05-09, 1924-05-14, 1924-05-21 и 1924-05-24.

7. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

7.1. Заполнение wiki-страниц по отдельным номерам журнала "Войвыв кодзув" (1961. №1; 2021. №10-12; 2022. №№1-3) и газеты "Југыԁ туј" за 1924-05-01, 1924-05-05, 1924-05-09, 1924-05-14, 1924-05-21 и 1924-05-24.

7.2. Создание wiki-страниц по номерам журнала "Ударник" (1940. №1-12) и издания  "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (1996-2002).

8. Работа с практикантами

8.1. Работа с практикантами - студентами Института точных наук и информационных технологий ФГБОУ ВПО "Сыктывкарский государственный университет им. Питирима Сорокина".

9. Участие в мероприятиях

9.1. Онлайн участие двух сотрудников в мероприятии: "Весенняя школа по сохранению, развитию и возрождению языков" (22–24 апреля 2022 г., Институт языкознания РАН, Москва).

9.2. Проведение вебинара в Коми республиканском институте развития образование на тему "Автоматическая проверка правописания в процессе обучения коми языку" (2022-04-15).

10. Добавление олайн-сервисов в раздел "Инструменты" сайта fu-lab.ru

10.1. Добавление сервиса построчного сравнения файлов.

10.2. Добавление сервиса создания tmx-файлов.

11. Пополнение словарной базы средства проверки правописания Hunspell:

10.1. Сбор новой лексики из коми текстов, обработанных в лаборатории в течение месяца.

10.2. Сортировка и индексация новой лексики, включение ее в коми словарную базу вариативной версии Hunspell.

12. Распространение комиязычного контента в соц. сетях.

13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

 
FU-Lab 2022.04.18-2022.04.22

опубликовал Öньö Лав в 19:23 21.04.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.04.18-2022.04.22.

 

  1.  
  2. Обработка в программе ABBYY FineReader ранее полученных сканов издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (2001. №№4-6).
  3. Распознавание в программе  ABBYY FineReader коми текстов издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (1996. №№1-6; 1997. №№7-10, 12; 2001. №1).
  4. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2022 №16).
  5. Обработка текстов издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2001. №1) и газеты "Коми му" (2022 №16) в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, расстановка языковых тэгов).
  6. Расстановка метаразметки для двух номеров издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (2001. №№1-2),  трех номеров журнала "Войвыв кодзув" (2002. №№1-3) и последнего номера газеты "Коми му" (2022 №16).
  7. Создание wiki-страниц для №№1-3 журнала "Войвыв кодзув" за 2002 г.  и всех номеров издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" за 1996-2001 гг. на сайте "Коми тӧданін".
  8. Начало перевода на коми язык текстов сайта администрации Сысольского района для коми локализации и корпуса параллельных текстов.
  9. Продолжение перевода с коми языка на русский текстов в жанре "репортаж" по материалам радио "Коми гор" за 2018 и 2019 гг.
  10. Добавление в корпус коми языка текстов журнала "Войвыв кодзув" (2002. №1-3), газеты "Коми му" (2021. №16), издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (2001. №№1,2). Обновление корпуса.
  11. Добавление в молодцовский корпус текстов комиязычных номеров газеты "Југыԁ туј" за 1924-05-21 и 1924-05-24, их размещение в переводе на современную графику в Коми онлайн библиотеке "Коми гижӧд".
  12. Обучение нового сотрудника лаборатории специфике работы при обработке сканов в программе в программе ABBYY FineReader  и обработке текстов в текстовых редакторах Xed и LibreOffice Writer.
  13. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  14. Распространение комиязычного контента в соц. сетях.
  15. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.04.11-2022.04.15

опубликовал Öньö Лав в 20:08 14.04.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.04.11-2022.04.15.

 

  1.  
  2. Правка новостных текстов "Коми гор" за 2017 г., создание метаразметок и разделение массива текстов на параллельные файлы с коми и русскоязычным контентом.     
  3. Продолжение перевода с коми языка на русский текстов в жанре "репортаж" по материалам радио "Коми гор" за 2018 и 2019 гг.
  4. Распознавание комиязычного текста старых номеров журнала "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (1997. №№1-6, 11; 2001. №2)
  5. Сканирование №11 журнала "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" за 1996 год.
  6. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2022 №15) и журнала "Войвыв кодзув" (2022 №№1-3), обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  7. Обработка ранее распознанного номера журнала "Войвыв кодзув" (1962 №1): проверка орфографии, метаразметка, расстановка языковых тэгов; заполнение wiki-страницы по данному номеру на сайте "Коми тӧданін".
  8. Добавление в корпус коми языка текстов, указанных в пп. 6, 7.
  9. Добавление в коми-пермяцкий корпус текстов газеты "Кама кытшын" за февраль-апрель 2022 гг. и комиязычных текстов "Югӧр_чукӧр" за 2014-2022 гг.
  10. Добавление в молодцовский корпус текстов комиязычного номера газеты "Југыԁ туј" за 1924-05-14, их размещение в переводе на современную графику в Коми онлайн библиотеке "Коми гижӧд".
  11. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.04.04-2022.04.08

опубликовал Öньö Лав в 21:39 07.04.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.04.04-2022.04.08.

 

  1.  
  2. Завершение создания метаразметок к новостным текстам радио "Коми гор" за 2020 г. Выдление в отдельный файл русскоязычного контента  для дальнейшего выравнивания с коми эквивалентом.
  3. Продолжение перевода с коми языка на русский текстов в жанре "репортаж" по материалам радио "Коми гор" за 2018 и 2019 гг.
  4. Правка новостных текстов и создание метаразметок к новостным текстам радио "Коми гор" за 2017 г.
  5. Сканирование, обработка  в программе ABBYY FineReader и создание pdf версии нового книжного издания "Вын" (2022).
  6. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2022 №14) и журнала "Йӧлӧга" (2022 №3), обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  7. Распознавание текста журнала "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (1996. №10), обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  8. Добавление в корпус коми языка текстов, указанных в пп. 6-7. Обновление корпуса.
  9. Заполнение wiki-страниц по отдельным номерам журнала "Войвыв кодзув" (2021. №10-12) и журнала "Ударник" (1940. №1-12)  на сайте "Коми тӧданін".
  10. Добавление в молодцовский корпус текстов комиязычных номеров газеты "Југыԁ туј" за 1924-05-05  и 1924-05-09, их размещение в переводе на современную графику в Коми онлайн библиотеке "Коми гижӧд".
  11. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  12. Редактирование индексации лексики в файле komi.dic спелл-чекера Hunspell.
  13. Распространение комиязычного контента в соц. сетях.
  14. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.03.28-2022.04.01

опубликовал Öньö Лав в 21:15 31.03.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.03.28-2022.04.01.

  1.  
  2. Продолжение перевода с коми языка на русский текстов в жанре "репортаж" по материалам радио "Коми гор" за 2018 г. и начало аналогичной работы по текстам 2019 г.
  3. Сборка новостных текстов радио "Коми гор" за 2020 г. и создание первичных метаразметок к текстам.
  4. Распознавание в программе ABBYY FineReader текстов №№2-7, 10-12 журнала "Ударник" за 1940 г., обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  5. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2022 №13), журналов "Йӧлӧга" (2022 №2) и "Войвыв кодзув" (2021 №№10-12), обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  6. Загрузка вновь полученных текстов в корпус коми языка. Обновление корпуса.
  7. Добавление в молодцовский корпус текстов комиязычного номера газеты "Југыԁ туј" за 1924-05-01 и их размещение в переводе на современную графику в Коми онлайн библиотеке "Коми гижӧд".
  8. Работа с практикантами - студентами Института точных наук и информационных технологий ФГБОУ ВПО "Сыктывкарский государственный университет им. Питирима Сорокина".
  9. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2022ʼ вося медводдза кварталысь отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 13:55 25.03.2022

2. Подготовка к созданию корпуса параллельных текстов (пара коми-русский) для локализации и онлайн-переводчика

2.1. Создание общих файлов tran_ru.txt и tran_kv.txt по собранным в 2021 году параллельным текстам художественной литературы на коми и русском языках, выравнивание строк в текстах указанных файлов в программе WinMerge. 84667 строк.
2.2. Создание файлов nt_ru.txt  и nt_kv.txt c текстами Нового завета на коми и русском языках (предварительное устранение нумерации, несовпадающих заголовков и т. п., унификация формата в программе gedit), выравнивание текстов на двух языках в программе WinMerge. 9014 строк.
2.3. Сбор русскоязычного материала сайта "Изьватас" и его выравнивание с коми переводом для корпуса параллельных текстов. 1073 строк.
2.4. Сбор материала для локализации муниципальных сайтов и сайтов государственных и муниципальных учреждений по ресурсам МО ГО Сыктывкар,  Сысольского, Усть-Куломского, Ижемского и Печорского районов.
2.5. Перевод материалов по истории с офиц. сайтов Ижемского и Печорского районов, а также материалов по  сельским поселениям с официального сайта  Ижемского района и сельских поселений Усть-Куломского района. 1337 строк.
2.6. Сборка текстов новостной ленты официальных порталов Республики Коми на коми и русском языках за декабрь 2012 – февраль 2022 года; выравнивание коми и русского эквивалента в программе WinMerge. 1350 строк
2.7. Сборка новостных текстов радио "Коми гор" на коми и русскоми языках за 2018 и 2019 гг., предоставленных ГТРК "Коми гор". Создание первичных метаразметок к текстам и их первичная обработка.  Перевод с коми на русский текстов в жанре "репортаж" по материалам радио "Коми гор" за 2018 г. По 2017 году произведено выдление в отдельный файл русскоязычного контента для дальнейшего выравнивания с коми текстом.
2.8. Изучение механизма локализации ОС Linux.

3. Текстовое пополнение и техническая оптимизация Корпуса коми языка:

3.1. Сканирование, обработка сканов и создания pdf-файлов по изданиям: О. И. Уляшев. "Кад пыр верзьӧмӧн" (2019), О. И. Уляшев. "Зарни бобув" (2021), "Долыд олан кад (1997), "Гажӧдчыштам" (2001), "Быдмӧм мывкыдӧн да авъяӧн" (2005), "Тӧдмӧдам челядьӧс вӧр-ваӧн" (2005), "Ӧтисянь дасӧдз" (2000)‎‎, "Вильышпоз" (2000).
3.2. Распознавание в программе ABBYY Fine Reader, обработка в программе LibreOffice (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текстов изданиий: О. И. Уляшев "Зарни бобув" (2021), Е. А. Игушев.  "Коми кывлӧн стилистика" (2003), "Долыд олан кад (1997), "Гажӧдчыштам" (2001), "Быдмӧм мывкыдӧн да авъяӧн" (2005), "Тӧдмӧдам челядьӧс вӧр-ваӧн" (2005), "Ӧтисянь дасӧдз" (2000)‎‎, "Вильышпоз" (2000), текстов журнала "Ударник" за 1940 г. (№1, 8-9).
3.3. Обработка (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) ранее распознанных текстов: К. Королёв. "Важ нэмъяслӧн гусяторъяс" (2006) и №№2-12 журнала "Войвыв кодзув" за 1962 год;
3.4. Вычитка и корректирование художественных текстов журнала "Войвыв кодзув" (№№ 7, 8, 11, 12 за 1975 г.),  текстов произведений В. Юхнина (публицистические, литературоведческие и драматические произведения), Е. А. Игушева из изданий "Чужан кыв — менам олӧм да вӧт" (1988) и "Коми кывйыс гажаджык на биысь" (1998).
3.5. Сравнение и корректирование в программе Meld двух редакций романа В. Юхнина "Шувгӧны пожӧмъяс" (1961 и 2007 гг.).
3.6. Извлечение из pdf файлов, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, метаразметка, расстановка языковых тэгов) и включение в корпус коми языка текстов свежих номеров газеты "Коми му" (2022 №№1-12) и журнала "Йӧлӧга" (2021 №12, 2022 №1).
3.7. Обработка текстов новостной ленты официальных порталов Республики Коми на коми языке за декабрь 2012 - февраль 2022 года (метаразметка, проверка текстов на орфографию в программе xed, сбор коми лексического материала для пополнения базы проверки правописания Hunspell).
3.8. Загрузка вновь полученных и откорректированных текстов в корпус коми языка. Еженедельное обновление корпуса. Объем корпуса на 25.03.2022 - 72 983 917 словоупотреблений.

4. Текстовое пополнение молодцовского корпуса:

4.1. Добавление в молодцовский корпус текстов 19 номеров газеты "Југыԁ туј" (1924-01-12, 1924-01-19, 1924-01-31, 1924-02-02, 1924-02-06, 1924-02-09, 1924-02-13, 1924-02-17, 1924-02-21, 1924-02-24, 1924-03-01, 1924-03-05, 1924-03-14, 1924-03-20, 1924-04-10, 1924-04-16, 1924-04-19, 1924-04-23 и 1924-04-26).
4.2. Регулярное обновление корпуса. Объем корпуса на 25.03.2022 -  1 825 699 словоупотреблений.

5. Создание и пополнение коми-пермяцкого корпуса:

5.1. Создание коми-пермяцкого раздела корпуса коми языка на основе текстов оригинальной художественной литературы (1921-2004 гг.).
5.2. Пополнение коми-пермяцкого корпуса текстами еженедельника "Кама кытшын" за 2019-20 гг.,  переводов на коми-пермяцкий язык по изданиям 1940-60 гг.,  учебников 1930-40 гг. и готовыми текстами молодцовского и латинского периода на современной графике. Метаразметка текстов.
5.3. Разпознавание текста на коми латинице издания "Priroda tədmalan kꞑiga. 5-ət vo" (1932).
5.4. Регулярное обновление корпуса. Объем на 25.03.2022 -  6 112 702 словоупотреблений.

6. Пополнение онлайн библиотеки "Коми гижӧд":

6.1. Размещение в онлайн библиотеке текстов произведений Е. А. Игушева из изданий "Чужан кыв — менам олӧм да вӧт" (1988), "Коми кывйыс гажаджык на биысь" (1998) и "Коми кывлӧн стилистика" (2003).
6.2. Размещение в онлайн библиотеке текстов произведений В. Юхнина по изданиям "Висьтъяс да очеркъяс" (1961), "Дінъёльса вӧрпункт" (1983), "Герой йылысь сказ" (1945), а также текстов того же автора, опубликованных в журналах "Войвыв кодзув" и "Ударник".
6.3. Размещение в коми онлайн библиотеке текстов произведений В. Лодыгина из издания "Лӧсас" (2013).
6.4. Размещение в онлайн библиотеке всех текстов комиязычных номеров газеты "Југыԁ туј" за январь-апрель 1924 года в переводе на современную графику.
6.5. Размещение в коми онлайн библиотеке «Коми гижӧд» (http://komikyv.org) аудиоматериала к текстам произведений коми писателей, предоставленного С. Г. Горчаковой (6-7 класс).
6.6. За отчетный период количество текстов в библиотеке возросло на 336 единиц.

7. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

7.1. Создание и заполнение информационных wiki-страниц по 9 изданиям: "Дневник Николая Фёдоровича Терентьева" (2021), "Долыд олан кад" (1997), "Ӧтисянь дасӧдз" (2000), "Гажӧдчыштам" (2001), "Быдмӧм мывкыдӧн да авъяӧн" (2005), "Тӧдмӧдам челядьӧс вӧр-ваӧн" (2005),  "Вильышпоз" (2000) , "Вын" (2022) и "Г. Бутырева. Ӧти бипур дорын" (2021), пополнение библиографии на страницах авторов данных изданий.
7.2. Создание и заполнение страниц по 19 комиязычным номерам газеты "Југыԁ туј" за январь-апрель 1924 года с добавлением ссылок на тексты статей из этих номеров, размещенные в онлайн-библиотеке "Коми гижӧд".
7.3. Добавление ссылок на произведения, размещенные в онлайн-библиотеке "Коми гижӧд", с wiki-страниц авторов Е. А. Игушев, В. Лодыгин и В. Юхнин.
7.4. Внесение информации о корректуре на wiki-страницы, посвященные №№2-12 журнала "Войвыв кодзув" за 1962 год.
7.5. Пополнение библиографии периодики содержанием номеров газеты «Коми му» (2022 г., № 39-52) и журнала «Йӧлӧга» (2021 г., № 9-11).
7.6. Дополнение указателя публикаций в журнале "Арт" материалом №№1, 3, 4 за 2020 г. и №№1-12 за 2021 гг.
7.7. Добавление изображений на страницы wiki-ресурса "Коми тӧданін", посвященные отдельным изданиям (+10).

8. Пополнение лексической базы FU-Lab":

8.1. Сортировка объединенного списка названий организаций и учреждений, созданного по материалам выполненных заявок БОП за 2012–2021 гг.; обработка общего списка (устранение вновь выявленных повторов, уточнение названий по данным официальных сайтов), создание разметки xml и загрузка "Русско-коми словаря названий организаций и учреждений" (3224 словарные статьи) на сайт Онлайн словари FU-Lab, редактирование онлайн версии словаря, унификация подачи аналогичных случаев.
8.2. Сбор и перевод на коми язык дополнительных названий республиканских и муниципальных учреждений и организаций  Республики Коми, а также названий их отделов и филиалов, не попавших в список, составленный по материалам выполненных заявок БОП за 2012–2021 гг.
8.3. Редактирование новых словарных статей для "Русско-коми словаря названий организаций и учреждений".
8.4. Выработка предложений для Коми РТОК по отдельным проблемам перевода.

9. Пополнение образовательного портала "Коми кыв"

9.1. Размещение на wiki-ресурсе образовательного портала "Коми кыв" текстов методических материалов О. И. Рочевой (6 изданий).
9.2. Сегментация в программе Sound Forge аудиматериала учебников Е. Н. Вязовой и  А. В. Сизовой "Коми кыв" для 3 и 4 классов, привязка аудио к текстам учебника на сайте http://audio.komikyv.ru.
9.3. Создание и обработка (добавление аудиоссылок на имеющийся озвученный материал, создание списка фраз для озвучки) текста онлайн версии разговорника "Сёрнитыштам ёртӧй" (2021) для образовательного портала "Коми кыв", начало работы по добавлению к разговорнику аудиоматериала.
9.4. Пополнение тематических разделов Коми-русского разговорника FU-Lab за счет дополнительных слов и фраз, представленных в «Русско-коми разговорнике» 2021 года.

10. Пополнение лингвистического сайта "Коми кыв"

10.1. Создание и обработка wiki-версии издания "Секреты коми языка" (2020) на wiki-ресурсе "Коми лингвистика".
10.2. Размещение информационных материалов по событиям сектора языка ИЯЛИ ФИЦ "КНЦ УрО РАН".

11. Пополнение коми аудиокорпуса:

11.1. Добавление в аудиобазу лаборатории файлов с выпусками радиопередачи "Миян кад" за ноябрь-декабрь 2021 г. и аудиофайлов с художественными текстами, предоставленными С. Г. Горчаковой.

12. Пополнение словарной базы средства проверки правописания Hunspell:

12.1. Сбор новой лексики из коми текстов, обработанных в лаборатории в течение отчетного периода.
12.2. Сортировка и индексация новой лексики, включение ее в коми словарную базу вариативной версии Hunspell.
12.3. Обновление лексической базы коми (вариативного) спелера в Онлайн-сервисе проверки орфографии

13. Работа с практикантами:

13.1. Ознакомление практикантов с деятельностью ЦИЯТ.
13.2. Опредление конкретных заданий для практикантов в рамках прохождения практики.

14. Участие в мероприятиях:

14.1. Участие в мероприятии «Ӧтувъя коми диктант».
14.2. Выступление на межрегиональной научно-практической онлайн конференции "Диалог культур — ценность гражданско-патриотического воспитания". Пермь-Кудымкар-Кочево, 17.02.2022 с информацией о комплексе комиязчычных онлайн ресурсов и перспективах его расширения за счет коми-пермяцкого материала.
14.3. Участие в трех вебинарах, организованных ГОУ ДПО "Коми республиканский институт развития образования": ознакомление слушателей с порядком установки коми раскладкок клавиатуры, особенностями функционирования и возможностями использования онлайн библиотеки "Коми гижӧд" и образовательного портала "Коми кыв".

15. Распространение комиязычного контента в соц. сетях.

16. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

2022ʼ рака тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 11:58 25.03.2022

 

2. Подготовка к созданию корпуса параллельных текстов (пара коми-русский) в рамках создания параллельного корпуса (kv-ru) и локализации сайтов:
2.1. Перевод и редактирование текстовых материалов с сайтов восьми сельских поселений Усть-Куломского района (Кужба, Пожег, Помоздино, Руч, Аныб, Усть-Нем, Усть-Кулом, Нижний Воч)
2.2. Сборка текстов новостной ленты официальных порталов Республики Коми на коми и русском языках за декабрь 2012 – февраль 2022 года, метаразметка, проверка текстов на орфографию в программе xed, сбор коми лексического материала для пополнения базы проверки правописания Hunspell; выравнивание коми и русского эквивалента в программе WinMerge.
2.3. Сборка новостных текстов радио "Коми гор" на коми и русскоми языках за 2018 и 2019 гг., предоставленных ГТРК "Коми гор" для включения в корпус коми языка и создания базы параллельного корпуса (kv-ru). Создание первичных метаразметок к текстам и их первичная обработка.  Перевод с коми на русский текстов в жанре "репортаж" по материалам радио "Коми гор" за 2018 г. По 2017 году произведено выдление в отдельный файл русскоязычного контента для дальнейшего выравнивания с коми текстом.

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2022 №№8, 9, 10, 11-12) и обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
3.2. Сканирование, обработка сканов и создание pdf копии издания "Вильышпоз" (2000), распознавание текстов данного издания в программе ABBYY FineReader.
3.3. Распознавание в программе ABBYY FineReader текстов №1, 8-9 журнала "Ударник" за 1940 г.
3.4. Вычитка и корректирование художественных текстов журнала "Войвыв кодзув" №№ 7, 8, 11, 12 за 1975 г.
3.5. Вычитка и корректирование текстов произведений В. Юхнина (публицистические, литературоведческие и драматические произведения).
3.6. Сравнение и корректирование в программе Meld двух редакций романа В. Юхнина "Шувгӧны пожӧмъяс" (1961 и 2007 гг.).
3.7. Загрузка вновь полученных и откорректированных текстов в корпус коми языка. Еженедельное обновление корпуса.
3.8. В корпус также добавлены тексты новостной ленты официальных порталов Республики Коми на коми и русском языках за декабрь 2012 - февраль 2022 года.

4. Текстовое пополнение и оптимизация молодцовского корпуса:

4.1. Добавление в молодцовский корпус текстов комиязычных номеров газеты "Југыԁ туј" за 1924-03-14, 1924-03-20, 1924-04-10, 1924-04-16, 1924-04-19, 1924-04-23 и 1924-04-26.

5. Работа над пополнением коми-пермяцкого корпуса
5.1. Разпознавание текста на коми латинице издания "Priroda tədmalan kꞑiga. 5-ət vo" (1932).

6. Пополнение онлайн библиотеки "Коми гижӧд":
6.1. Вычитка и размещение в коми онлайн библиотеке текстов произведений В. Лодыгина из издания "Лӧсас" (2013): "Сьӧлӧмыд тшӧктытӧг сьылӧ..."; "Сьӧлӧм гажӧдчыны корӧ..."; "Кытшӧн йӧктам-бергалам, нимкодясям-гажӧдчам..."; "Мича нывъяслы"; "Баруня"; "Зырянка"; "Изъя шорӧ гудӧк корӧ..."; "Коръяс окасьмӧн сӧмын тӧлалӧ..."; "Тулысыс воис да, шоналім..."; "Гӧрд сикӧтша, лӧз чышъяна..."; "Мый нӧ эськӧ тайӧ лоис..."; "Мича эськӧ тайӧ зонмыс..."; "Банйис ӧшинь улын пелысь..."; "Югыд вӧлі, джуджыд вӧлі..."; "Томлун"; "Ветлі да, ветлі да раскӧдыс дыр..."; "Гашкӧ, Енмыс менӧ ёрис..."; "Тані оз, коляоз..."; "Йитіс баддя берегъяс..."; "Рака тӧлысь..."; "Вотчанінысь чышъян сюрис..."; "Тася"; "Еджыд Райда"; "Жоньыс пелысьсӧ кушӧдз кокаліс..."; "Арыс зэв нин кӧдзыд лола…"..
6.2. Размещение в коми онлайн библиотеке "Коми гижӧд" текстов публицистических, литературоведческих и драматургических произведений В. Юхнина, опубликованных в журналах "Войвыв кодзув" и "Ударник".
6.3. Размещение в Коми онлайн библиотеке "Коми гижӧд"  в переводе на современную графику текстов комиязычных номеров газеты "Југыԁ туј" за 1924-03-14, 1924-03-20, 1924-04-10, 1924-04-16, 1924-04-19, 1924-04-23, 1924-04-26.

7. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":
7.1. Создание и заполнение wiki-страниц, посвященных комиязчыным книжным изданиям  "Вильышпоз" (2000) , "Вын" (2022) и "Г. Бутырева. Ӧти бипур дорын" (2021), пополнение библиографии на страницах авторов данных изданий.
7.2. Создание ссылок на  произведений В. Лодыгина и В. Юхнина, размещенные в текущем месяце в коми онлайн библиотеке "Коми гижӧд" с wiki-страниц авторов.
7.3. Дополнение указателя публикаций в журнале "Арт" материалом №№1, 3, 4 за 2020 г. и №№1-12 за 2022 гг.

8. Пополнение лексической базы для интегрального и тематических словарей :
8.1. Перевод названий организаций, учреждений и их подразделений МОМР "Усть-Куломский" и МОГО "Ухта", в дополнение к имеющимся словарным статьям для "Русско-коми словаря названий организаций и учреждений" на сайте Онлайн словари FU-Lab и оформление разметки материала для последующей публикации.
8.2. Редактирование новых словарных статей для "Русско-коми словаря названий организаций и учреждений".

9. Образовательный портал Коми кыв
9.1. Продолжение обработки (добавление аудиоссылок на имеющийся озвученный материал, создание списка фраз для озвучки) текста онлайн версии «Русско-коми разговорника» (2021) на сайте audio.komikyv.ru для дальнейшего подключения аудиоматериалов
9.2. Пополнение тематических разделов Коми-русского разговорника FU-Lab за счет дополнительных слов и фраз, представленных в «Русско-коми разговорнике» 2021 года.

10. Работа с практикантами
10.1 Работа с практикантами - студентами Института точных наук и информационных технологий ФГБОУ ВПО "Сыктывкарский государственный университет им. Питирима Сорокина".

11. Участие в мероприятиях
11.1. Участие в вебинарах, организованных ГОУ ДПО "Коми республиканский институт развития образования": ознакомление слушателей с особенностями функционирования и возможностями использования онлайн библиотеки "Коми гижӧд" и образовательного портала "Коми кыв".
11.2. Участие в мероприятии «Ӧтувъя коми диктант».

12. Пополнение словарной базы средства проверки правописания Hunspell:
12.1. Сбор новой лексики из коми текстов, обработанных в лаборатории в течение месяца.
12.2. Сортировка и индексация новой лексики, включение ее в коми словарную базу вариативной версии Hunspell.

13. Распространение комиязычного контента в соц. сетях.

14. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

FU-Lab 2022.03.21-2022.03.25

опубликовал Öньö Лав в 17:15 24.03.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.03.21-2022.03.25.

  1.  
  2. Распознавание в программе ABBYY FineReader текстов издания "Вильышпоз" (2000), а также №1, 8-9 журнала "Ударник" за 1940 г.
  3. Вычитка, корректирование и размещение в коми онлайн библиотеке "Коми гижӧд" текстов публицистических, литературоведческих и драматических произведений В. Юхнина. Создание ссылок на данные публикации с wiki-страницы автора в справочном wiki-ресурсе "Коми тӧданін".
  4. Сравнение и корректирование в программе Meld двух редакций романа В. Юхнина "Шувгӧны пожӧмъяс" (1961 и 2007 гг.). Размещение откорректированного текста данного произведения в коми онлайн библиотеке "Коми гижӧд".
  5. Продолжение перевода с коми языка на русский текстов в жанре "репортаж" по материалам радио "Коми гор" за 2018 г.
  6. Завершение создания первичных метаразметок к новостным текстам радио "Коми гор" за 2019 г., выдление в отдельный файл русскоязычного контента для дальнейшего выравнивания с коми текстом.
  7. Создание и заполнение в справочном wiki-ресурсе "Коми тӧданін" информационных wiki-страниц по новым  комиязчыным книжным изданиям: "Вын" (2022) и "Г. Бутырева. Ӧти бипур дорын" (2021), пополнение библиографии на страницах авторов данных изданий.
  8. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2022 №11-12) и обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  9. Загрузка вновь полученных и откорректированных текстов в корпус коми языка. Обновление корпуса.
  10. Добавление в молодцовский корпус текстов комиязычных номеров газеты "Југыԁ туј" за 1924-04-23, 1924-04-26 и их размещение в переводе на современную графику в Коми онлайн библиотеке "Коми гижӧд".
  11. Продолжение разпознавания текста на коми латинице издания "Priroda tədmalan kꞑiga. 5-ət vo" (1932) для пермяцкого раздела корпуса коми языка.
  12. Дополнение указателя публикаций в журнале "Арт" материалом №№1, 3, 4 за 2020 г. и №№1-12 за 2022 гг.  в справочном wiki-ресурсе "Коми тӧданін".
  13. Редактирование новых словарных статей для "Русско-коми словаря названий организаций и учреждений".
  14. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  15. Распространение комиязычного контента в соц. сетях.
  16. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.03.14-2022.03.18

опубликовал Öньö Лав в 10:36 18.03.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.03.14-2022.03.18.
     

 

  1.  
  2. Завершение перевода названий организаций и учреждений МОГО "Ухта" в дополнение к имеющимся в словарных статьях "Русско-коми словаря названий организаций и учреждений" названиям; оформление разметки материала для последующей публикации на сайте Онлайн словари FU-Lab.
  3. Сборка новостных текстов радио "Коми гор" за 2019 г., предоставленных ГТРК "Коми гор" для включения в корпус коми языка и создания базы параллельного корпуса (kv-ru).
  4. Создание первичных метаразметок к текстам радио "Коми гор" за 2018 и 2019 гг., первичная обработка текстов.
  5. Перевод с коми на русский текстов в жанре "репортаж" по материалам радио "Коми гор" за 2018 г.
  6. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2022 №10), обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и их загрузка в корпус коми языка.    
  7. Добавление в молодцовский корпус текстов комиязычного номера газеты "Југыԁ туј" за 1924-04-19 и их размещение в переводе на современную графику в Коми онлайн библиотеке "Коми гижӧд".
  8. Продолжение разпознавания текста на коми латинице издания "Priroda tədmalan kꞑiga. 5-ət vo" (1932) для пермяцкого раздела корпуса коми языка.
  9. Сканирование, обработка сканов и создание pdf копии издания "Вильышпоз" (2000), создание страницы посвященной данному изданию на справочном wiki-ресурсе "Коми тӧданін"
  10. Работа с практикантами - студентами Института точных наук и информационных технологий ФГБОУ ВПО "Сыктывкарский государственный университет им. Питирима Сорокина".
  11. Участие в вебинарах, организованных ГОУ ДПО "Коми республиканский институт развития образования": ознакомление слушателей с особенностями функционирования и возможностями использования онлайн библиотеки "Коми гижӧд" и образовательного портала "Коми кыв".
  12. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  13. Распространение комиязычного контента в соц. сетях.
  14. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.03.07-2022.03.11

опубликовал Öньö Лав в 10:31 11.03.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.03.07-2022.03.11.

  1.  
  2. Продолжение перевода названий организаций и учреждений МОГО "Ухта" в дополнение к имеющимся в словарных статьях "Русско-коми словаря названий организаций и учреждений" названиям; оформление разметки материала для последующей публикации на сайте Онлайн словари FU-Lab.
  3. Перевод и редактирование текстовых материалов с сайтов трех сельских поселений Усть-Куломского района (Усть-Нем, Усть-Кулом, Нижний Воч) в рамках создания параллельного корпуса (kv-ru) и локализации сайтов.
  4. Сборка новостных текстов радио "Коми гор" на коми и русскоми языках за 2018 г., предоставленных ГТРК "Коми гор" для включения в корпус коми языка и создания базы параллельного корпуса (kv-ru).
  5. Сборка текстов новостной ленты официальных порталов Республики Коми на коми и русском языках за январь-февраль 2022 года, метаразметка, проверка текстов на орфографию в программе xed, сбор коми лексического материала для пополнения базы проверки правописания Hunspell; выравнивание коми и русского эквивалента в программе WinMerge.
  6. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2022 №9), обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и их загрузка в корпус коми языка.    
  7. Добавление в молодцовский корпус текстов комиязычных номеров газеты "Југыԁ туј" за 1924-04-10  и 1924-04-16 и их размещение в переводе на современную графику в Коми онлайн библиотеке "Коми гижӧд".
  8. Продолжение разпознавания текста на коми латинице издания "Priroda tədmalan kꞑiga. 5-ət vo" (1932) для пермяцкого раздела корпуса коми языка.
  9. Продолжение обработки (добавление аудиоссылок на имеющийся озвученный материал, создание списка фраз для озвучки) текста онлайн версии «Русско-коми разговорника» (2021) на сайте audio.komikyv.ru для дальнейшего подключения аудиоматериалов
  10. Пополнение тематических разделов Коми-русского разговорника FU-Lab за счет дополнительных слов и фраз, представленных в «Русско-коми разговорнике» 2021 года.
  11. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.02.28-2022.03.04

опубликовал Öньö Лав в 10:54 05.03.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.02.28-2022.03.04

 

  1.  
  2. Перевод и редактирование названий организаций, учреждений и их подразделений МОМР "Усть-Куломский" и МОГО "Ухта", в дополнение к имеющимся словарным статьям для "Русско-коми словаря названий организаций и учреждений" на сайте Онлайн словари FU-Lab и оформление разметки материала для последующей публикации.
  3. Перевод и редактирование текстовых материалов с сайтов пяти сельских поселений Усть-Куломского района (Кужба, Пожег, Помоздино, Руч, Аныб) в рамках создания параллельного корпуса (kv-ru) и локализации сайтов.
  4. Продолжение обработки (добавление аудиоссылок на имеющийся озвученный материал, создание списка фраз для озвучки) текста онлайн версии «Русско-коми разговорника» (2021) на сайте audio.komikyv.ru для дальнейшего подключения аудиоматериалов.
  5. Вычитка и размещение в коми онлайн библиотеке текстов произведений В. Лодыгина из издания "Лӧсас" (2013): "Сьӧлӧмыд тшӧктытӧг сьылӧ..."; "Сьӧлӧм гажӧдчыны корӧ..."; "Кытшӧн йӧктам-бергалам, нимкодясям-гажӧдчам..."; "Мича нывъяслы"; "Баруня"; "Зырянка"; "Изъя шорӧ гудӧк корӧ..."; "Коръяс окасьмӧн сӧмын тӧлалӧ..."; "Тулысыс воис да, шоналім..."; "Гӧрд сикӧтша, лӧз чышъяна..."; "Мый нӧ эськӧ тайӧ лоис..."; "Мича эськӧ тайӧ зонмыс..."; "Банйис ӧшинь улын пелысь..."; "Югыд вӧлі, джуджыд вӧлі..."; "Томлун"; "Ветлі да, ветлі да раскӧдыс дыр..."; "Гашкӧ, Енмыс менӧ ёрис..."; "Тані оз, коляоз..."; "Йитіс баддя берегъяс..."; "Рака тӧлысь..."; "Вотчанінысь чышъян сюрис..."; "Тася"; "Еджыд Райда"; "Жоньыс пелысьсӧ кушӧдз кокаліс..."; "Арыс зэв нин кӧдзыд лола…".. Создание ссылок на публикации с wiki-страницы автора на справочном wiki-ресурсе "Коми тӧданін".
  6. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2022 №8), обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и их загрузка в корпус коми языка.    
  7. Корректура текстов журнала "Войвыв кодзув" №№ 7, 8, 11, 12 за 1975 г. в корпусе коми языка.
  8. Добавление в молодцовский корпус текстов комиязычных номеров газеты "Југыԁ туј" за 1924-03-14 и 1924-03-20 и их размещение в переводе на современную графику в Коми онлайн библиотеке "Коми гижӧд".
  9. Разпознавание текста на коми латинице издания "Priroda tədmalan kꞑiga. 5-ət vo" (1932) для пермяцкого раздела корпуса коми языка.
  10. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
  12. Участие в мероприятии «Ӧтувъя коми диктант».
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2022ʼ урасьӧмся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 22:03 24.02.2022

2. Подготовка к созданию корпуса параллельных текстов (пара коми-русский) и локализация:

2.1. Сбор русскоязычного материала сайта "Изьватас" и его выравнивание с коми переводом для корпуса параллельных текстов.
2.2. Сбор материала для локализации муниципальных сайтов и сайтов государственных и муниципальных учреждений по ресурсам МО ГО Сыктывкар,  Сысольского, Усть-Куломского, Ижемского и Печорского районов.
2.3. Перевод материалов по истории с офиц. сайтов Ижемского и Печорского районов, а также материалов по  сельским поселениям с официального сайта  Ижемского района и сельских поселений Усть-Куломского района.
2.4. Изучение механизма локализации ОС Linux.

3. Текстовое пополнение Корпуса коми языка:
3.1. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2022 №3-7) и журнала "Йӧлӧга" (2021 №12, 2022 №1) и их обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов)
3.2. Обработка (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) распознанных текстов "К. Королёв. Важ нэмъяслӧн гусяторъяс" (2006) и №№2-12 журнала "Войвыв кодзув" за 1962 год;
3.3. Сканирование, распознавание в программе ABBYY FineReader, обработка  в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка текстов изданий "Долыд олан кад (1997), "Гажӧдчыштам" (2001), "Быдмӧм мывкыдӧн да авъяӧн" (2005), "Тӧдмӧдам челядьӧс вӧр-ваӧн" (2005), "Ӧтисянь дасӧдз" (2000)‎‎.
3.4. Загрузка в корпус коми языка  указанных в п. 3.1-3.3. изданий и еженедельное обновление корпуса.

4. Текстовое пополнение молодцовского корпуса:
4.1. Добавление в молодцовский корпус текстов комиязычных номеров газеты "Југыԁ туј" за 1924-02-02, 1924-02-06, 1924-02-09, 1924-02-13, 1924-02-17, 1924-02-21, 1924-02-24, 1924-03-01 и 1924-03-05.

5. Создание и пополнение коми-пермяцкого корпуса:
Создание коми-пермяцкого раздела корпуса коми языка и пополнение его текстами оригинальной художественной литературы (1921-2004), еженедельника "Кама кытшын" за 2019-20 гг., текстов переводной литературы 1940-60 гг., текстов учебников 1930-40 гг. и готовых текстов молодцовского и латинского периода на современной графике.

6. Пополнение онлайн библиотеки "Коми гижӧд":
6.1. Размещение в коми онлайн библиотеке текстов произведений В. Юхнина по изданиям "Висьтъяс да очеркъяс" (1961) и "Дінъёльса вӧрпункт" (1983).
6.2. Размещение в коми онлайн библиотеке «Коми гижӧд» (http://komikyv.org) аудиоматериала к текстам произведений коми писателей, предоставленного С. Г. Горчаковой (6-7 класс).
6.3. Размещение в Коми онлайн библиотеке "Коми гижӧд"  в переводе на современную графику текстов комиязычных номеров газеты "Југыԁ туј" за 1924-02-02, 1924-02-06, 1924-02-09, 1924-02-13, 1924-02-17, 1924-02-21, 1924-02-24, 1924-03-01 и 1924-03-05.

7. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":
7.1. Создание и заполнение страниц по комиязычным номерам газеты "Југыԁ туј" за 1924-02-02, 1924-02-06, 1924-02-09, 1924-02-13, 1924-02-17, 1924-02-21, 1924-02-24, 1924-03-01 и 1924-03-05 с добавлением ссылок на тексты статей из этих номеров, размещенные в онлайн-библиотеке "Коми гижӧд".
7.2. Внесение информации о корректуре на wiki-страницы, посвященные №№10-12 журнала "Войвыв кодзув" за 1962 год .
7.3. Создание и заполнение информационных wiki-страниц по изданиям "Долыд олан кад" (1997), "Ӧтисянь дасӧдз" (2000), "Гажӧдчыштам" (2001), "Быдмӧм мывкыдӧн да авъяӧн" (2005), "Тӧдмӧдам челядьӧс вӧр-ваӧн" (2005)‎‎.

8. Пополнение образовательного портала "Коми кыв"

8.1. Размещение на wiki-ресурсе образовательного портала "Коми кыв" текстов методических материалов О. И. Рочевой (6 изданий).
8.2. Сегментация в программе Sound Forge аудиматериала учебников Е. Н. Вязовой и  А. В. Сизовой "Коми кыв" для 3 и 4 классов, привязка аудио к текстам учебника на сайте http://audio.komikyv.ru.
8.3. Создание и обработка онлайн версии разговорника "Сёрнитыштам ёртӧй" (2021) для образовательного портала "Коми кыв", начало работы по добавлению к разговорнику аудиоматериала.

9. Пополнение лингвистического сайта "Коми кыв"

9.1. Создание и обработка wiki-версии издания "Секреты коми языка" (2020) на wiki-ресурсе "Коми лингвистика".
9.2. Размещение информационных материалов по событиям сектора языка ИЯЛИ ФИЦ "КНЦ УрО РАН".

10. Пополнение лексической базы словарей:
10.1. Сбор дополнительного материала по названиям учреждений, организаций и их подразделений для "Русско-коми словаря названий организаций и учреждений".
10.2. Перевод с русского языка на коми язык названий учреждений здравоохранения Республики Коми и их подразделений, а также названий муниципальных учреждений (с их подразделениями) Сыктывдинского, Усть-Куломского и Корткеросского района.
10.3. Редактирование переводов и пополнение "Русско-коми словаря названий организаций и учреждений".
10.4. Разработка предложений в ТОК по нормализации перевода ряда слов и словосочетаний с русского языка на коми.

11. Работа со студентами:
11.1. Ознакомление практикантов СГУ с деятельностью ЦИЯТ, даны первые задания в рамках прохождения практики.

12. Участие в мероприятиях:
12.1. Участие в мероприятии «Ӧтувъя коми диктант».
12.2. Выступление на межрегиональной научно-практической онлайн конференции "Диалог культур — ценность гражданско-патриотического воспитания". Пермь-Кудымкар-Кочево, 17.02.2022 с информацией о комплексе комиязчычных онлайн ресурсов и перспективах его расширения за счет коми-пермяцкого материала.

13. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.

14. Распространение комиязычного контента в соц. сетях.
    
15. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

FU-Lab 2022.02.21-2022.02.25

опубликовал Öньö Лав в 20:24 24.02.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.02.21-2022.02.25

  1.  
  2. Вычитка и размещение в коми онлайн библиотеке текстов очерков и рассказов В. Юхнина по изданию "Висьтъяс да очеркъяс" (1961).
  3. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2022 №7), обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и их загрузка в корпус коми языка.
  4. Добавление в молодцовский корпус текстов комиязычных номеров газеты "Југыԁ туј" за 1924-03-01 и 1924-03-05 и их размещение в переводе на современную графику в Коми онлайн библиотеке "Коми гижӧд".
  5. Метаразметка и добавление в коми-пермяцкий корпус текстов учебников 1930-40 гг. и готовых текстов молодцовского и латинского периода на современной графике.
  6. Перевод и редактирование текстовых материалов по сельским поселениям с официального сайта  Ижемского района и сайтов пяти сельских поселений Усть-Куломского района.
  7. Пополнение и обновление "Русско-коми словаря названий организаций и учреждений".
  8. Завершение сегментации в программе Sound Forge и подключение аудиоматериала к странице учебника Е. Н. Вязовой и А. В. Сизовой "Коми кыв. 4 класс" (2013) на образовательном портале Коми кыв.
  9. Начало работы по аудиоматериалу к онлайн версии разговорника "Сёрнитыштам ёртӧй" (2021) на образовательном портале "Коми кыв".
  10. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
  12. Участие в мероприятии «Ӧтувъя коми диктант».
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.02.14-2022.02.18

опубликовал Öньö Лав в 10:34 18.02.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.02.14-2022.02.18

 

  1.  
  2. Обработка онлайн версии разговорника "Сёрнитыштам ёртӧй" (2021) на образовательном портале "Коми кыв".
  3. Обработка wiki-версии издания "Секреты коми языка" (2020) на wiki-ресурсе "Коми лингвистика".
  4. Сканирование и распознавание текста издания "О. Рочева. Ӧтисянь дасӧдз" (2000)‎‎.  
  5. Размещение текстов методических материалов О. И. Рочевой на wiki-ресурсе образовательного портала "Коми кыв" (6 изданий).
  6. Размещение в коми онлайн библиотеке текста повести В. Юхнина "Дінъёльса вӧрпункт" (по изданию 1983 г.).
  7. Обработка и включение в корпус коми языка текста издания "К. Королёв. Важ нэмъяслӧн гусяторъяс" (2006).
  8. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2022 №6) и журнала "Йӧлӧга" (2021 №12, 2022 №1), обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и их загрузка в корпус коми языка.
  9. Добавление в молодцовский корпус текстов комиязычного номера газеты "Југыԁ туј" за 1924-02-21 и 1924-02-24 и их размещение в переводе на современную графику в Коми онлайн библиотеке "Коми гижӧд".
  10. Добавление в коми-пермяцкий корпус текстов переводной литературы 1940-60 гг.
  11. Перевод материалов по истории с офиц. сайтов Ижемского и Печорского районов, редактирование перевода.
  12. Пополнение и обновление "Русско-коми словаря названий организаций и учреждений".
  13. Сбор русскоязычного материала сайта "Изьватас" и его выравнивание с коми переводом для корпуса параллельных текстов.
  14. Сегментация в программе Sound Forge аудиоматериала учебника Е. Н. Вязовой и  А. В. Сизовой "Коми кыв. 4 класс" (2013).
  15. Выступление на межрегиональной научно-практической онлайн конференции "Диалог культур — ценность гражданско-патриотического воспитания". Пермь-Кудымкар-Кочево, 17.02.2022 с информацией о комплексе комиязчычных онлайн ресурсов и перспективах его расширения за счет коми-пермяцкого материала.
  16. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  17. Распространение комиязычного контента в соц. сетях.
  18. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.02.07-2022.02.11

опубликовал Öньö Лав в 10:37 11.02.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.02.07-2022.02.11

  1.  
  2. Распознавание, обработка  в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка текстов изданий "Долыд олан кад (1997), "Гажӧдчыштам" (2001), "Быдмӧм мывкыдӧн да авъяӧн" (2005), "Тӧдмӧдам челядьӧс вӧр-ваӧн" (2005). На wiki-ресурсе "Коми тӧданін" созданы и заполнены информационные страницы по данным изданиям.
  3. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2022 №5), их обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  4. Разработка онлайн версии разговорника "Сёрнитыштам ёртӧй" (2021) на образовательном портале "Коми кыв".
  5. Разработка wiki-версии издания "Секреты коми языка" (2020) на wiki-ресурсе "Коми лингвистика".
  6. Добавление в молодцовский корпус текстов комиязычного номера газеты "Југыԁ туј" за 1924-02-17 и их размещение в переводе на современную графику в Коми онлайн библиотеке "Коми гижӧд".
  7. Добавление в коми-пермяцкий корпус текстов еженедельника "Кама кытшын" за 2019-20 гг.
  8. Сбор материала для коми локализации муниципальных сайтов по ресурсам Усть-Куломского, Ижемского и Печорского районов.
  9. Тестовый перевод раздела "Общие сведения" сайта администрации МОГО "Печора".
  10. Пополнение и обновление "Русско-коми словаря названий организаций и учреждений".
  11. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  12. Изучение механизма локализации ОС Linux.
  13. Ознакомление практикантов СГУ с деятельностью ЦИЯТ, даны первые задания в рамках прохождения практики.
  14. Распространение комиязычного контента в соц. сетях.
  15. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.01.31-2022.02.04

опубликовал Öньö Лав в 21:47 03.02.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.01.31-2022.02.04

  1.  
  2. Завершение обработки (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) распознанных текстов журнала "Войвыв кодзув" за 1962 год (№№10-12); информация об изменениях сделана на соответствующих страницах wiki-ресурса "Коми тӧданін".
  3. · Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2022 №4) и их обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  4. · Добавление в корпус коми языка №№2-12 журнала "Войвыв кодзув" за 1962 год и свежего номера газеты "Коми му" (2022 №4). Обновление корпуса.
  5. · Добавление в молодцовский корпус текстов комиязычного номера газеты "Југыԁ туј" за 1924-02-13 и их размещение в переводе на современную графику в Коми онлайн библиотеке "Коми гижӧд".
  6. · Разработка предложений в ТОК по нормализации перевода ряда слов и словосочетаний с русского языка на коми.
  7. · Сбор материала для локализации муниципальных сайтов и сайтов государственных и муниципальных учреждений по ресурсам Усть-Куломского района.
  8. · Сбор дополнительного материала по названиям учреждений, организаций и их подразделений.
  9. · Перевод с русского языка на коми язык названий учреждений здравоохранения Республики Коми и их подразделений, а также названий муниципальных учреждений (с их подразделениями) Сыктывдинского и Усть-Куломского района; редактирование переводов и пополнение "Русско-коми словаря названий организаций и учреждений".
  10. · Размещение в коми онлайн библиотеке «Коми гижӧд» (http://komikyv.org)  аудиоматериала к текстам произведений коми писателей, предоставленного С. Г. Горчаковой (6-7 класс).
  11. · Сегментация в программе Sound Forge аудиматериала учебника Е. Н. Вязовой и  А. В. Сизовой "Коми кыв" (2013), привязка аудио к текстам учебника на сайте http://audio.komikyv.ru (ок. 300 единиц). Извлечение из общего аудиофайла учебника недостающих (неозвученных) слов.
  12. · Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  13. · Распространение комиязычного контента в соц. сетях.
  14. · Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
Яндекс.Метрика