FU-Lab 22.11.2021–26.11.2021

опубликовал Öньö Лав в 14:33 24.11.2021

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 22.11.2021–26.11.2021.

  1.  
  2. Сборка, предварительная обработка, метаразметка и выравнивание в программе WinMerg  параллельных (коми и русских) текстов официально-делового стиля из файлов БОП, содержащих НПА РК за ноябрь-декабрь 2011 (постановления правительства РК), проверка текстов на орфографию в программе xed, сбор лексического материала для пополнения базы проверки правописания Hunspell.
  3. Проверка орфографии в текстах официально-делового стиля на русском и коми языках из файлов БОП, содержащих НПА РК за 2013 г. (Законы РК №42, 73, 120) в программе xed, сбор лексического материала для пополнения базы проверки правописания Hunspell.
  4. Контрольное выравнивание в программе WinMerge текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2017, 2018, 2020 гг.
  5. Проверка орфографии текстов Постановлений Конституционного суда РК на коми языке за 2003-2020 годы, сбор лексического материала для пополнения базы проверки правописания Hunspell.
  6. Сбор текстов Постановлений Конституционного суда РК на коми языке за 2021 год, метразметка, проверка орфографии, сбор лексического материала для пополнения базы проверки правописания Hunspell.
  7. Сборка русских оригиналов Постановлений Конституционного суда РК  за 2009-2021 гг.  и их выравнивание в программе WinMerg с коми переводами.
  8. Сборка, обработка, метаразметка и выравнивание в программе WinMerge текстов на коми и русском языках из файлов БОП, содержащих Избирательные бюллетени РК за 2014-2015, 2017-2020 гг.; проверка текстов на орфографию в программе xed, сбор коми лексического материала для пополнения базы проверки правописания Hunspell.
  9. Сборка текстов новостных порталов РК на коми и русском языках за октябрь-ноябрь 2021 года, метаразметка, проверка текстов на орфографию в программе xed, сбор коми лексического материала для пополнения базы проверки правописания Hunspell; выравнивание коми и русского эквивалента в программе WinMerge.
  10. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2021 №47) и их обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  11. Пополнение словарной базы спелл-чеккера новой лексикой, выявленной в обрабатываемых текстах.
  12. Включение новых обработанных текстов (нормативно-правовые акты, газета "Коми му", тексты новостных сайтов) в корпус коми языка. Обновление корпуса.
  13. Добавление в молодцовский корпус текстов комиязычного номера газеты "Југыԁ туј" за  1923-12-12, включение данных текстов в переводе на современную графику в онлайн библиотеку "Коми гижӧд".
  14. Включение аудиофайлов радиопередачи "Миян кад" за август-октябрь 2021 г. в базу аудиокорпуса.
  15. Размещение в онлайн библиотеке "Коми гижӧд" текстов публикаций Е. А. Цыпанова и Е. А. Игушева из еженедельника "Коми му" за 2000 и 2021 гг.
  16. Распространение комиязычного контента в соц. сетях.
  17. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 15.11.2021–19.11.2021

опубликовал Öньö Лав в 18:05 18.11.2021

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 15.11.2021–19.11.2021.

  1.  
  2. Проверка в программе xed с помощью спелл-чекера hunspell текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2012, 2015-2020 годы, а также постановления правительства РК за 2013 год; корригирование орфографии, сбор нового лексического материала в коми текстах.
  3. Повторное выравнивание в программе WinMerge текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2015 и 2019 гг.
  4. Продолжение первичного выравнивания в программе WinMerge допонительных текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих приложения к законам Республики Коми за 2013 г.
  5. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2021 №46) и их обработка программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  6. Пополнение словарной базы спелл-чеккера новой лексикой, выявленной в обрабатываемых текстах.
  7. Пополнение корпуса коми языка текстами Постановлений правительства Республики Коми за 2013 год и текстами последнего номера газеты "Коми му" (2021 №46), замена в корпусе текстов НПА РК за 2012, 2015-2020 гг. откорригированными текстами. Обновление корпуса.
  8. Добавление в молодцовский корпус текстов комиязычного номера газеты "Југыԁ туј" за  1923-12-08, включение данных текстов в переводе на современную графику в онлайн библиотеку "Коми гижӧд".
  9. Подключение аудиофайлов с выпусками радиопередачи "Миян кад" за август-октябрь 2021 г. к базе аудиокорпуса.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 08.11.2021–12.11.2021

опубликовал Öньö Лав в 11:07 11.11.2021

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 08.11.2021–12.11.2021.

2. Продолжение выравнивания текстов официально-делового стиля (постановления правительства РК) на коми и русском языках из файлов БОП, содержащих НПА РК  за 2013 г.
3. Завершение выравнивания и объединение текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2014 г.
4. Проверка текстов, указанных в п. 2 и 3 в программе  xed с помощью спелл-чекера hunspell, корригирование орфографии и сбор нового лексического материала.
5. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2021 №№44, 45) и их обработка программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
6. Пополнение словарной базы коми спелл-чекера hunspell новой лексикой из текстов, указанных в п. 2, 3 и 5.
7. Добавление в корпус коми языка текстов, указанных в п. 3 и 5. Обновление корпуса.
8. Продолжение работы по сравнению в программа Meld редакций прозаических текстов корпуса в целях устранения оставшихся после распознавания опечаток (повести Г. Юшкова).
9. Добавление в молодцовский корпус текстов комиязычных номеров газеты "Југыԁ туј" за  1923-12-01 и 1923-12-05, включение данных текстов в переводе на современную графику в онлайн библиотеку "Коми гижӧд".
10. Распространение комиязычного контента в соц. сетях.
11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

FU-Lab 01.11.2021–03.11.2021

опубликовал Öньö Лав в 20:24 02.11.2021

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 01.11.2021–03.11.2021.

2. Предварительная обработка, метаразметка и выравнивание в программе WinMerge текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2013 г.
3. Выравнивание в программе WinMerge текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2014 г.
4. Извлечение из pdf файла текстов свежего номера журнала "Йӧлӧга" (2021 №10) и их обработка (выравнивание абзацев, проверка орфографии, метаразметка, расстановка языковых тэгов).
5. Работа со студентами СГУ по их участию в созданий корпуса параллельных текстов (kv-ru) в части новостных публикаций портала rkomi.ru
6. Продолжение работы по сравнению в программа Meld редакций прозаических текстов в целях устранения оставшихся после распознавания опечаток (повести Г. Юшкова).
7. Распространение комиязычного контента в соц. сетях.
8. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

FU-Lab 25.10.2021–29.10.2021

опубликовал Öньö Лав в 20:56 28.10.2021

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 25.10.2021–29.10.2021.

2. Завершение сборки и начало предварительной обработки текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2013 г. для дальнейшей метаразметки и выравнивания.
3. Завершение предварительной обработки и разметка  текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2014 г. для дальнейшего выравнивания.
4. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2021 №43), их обработка (выравнивание абзацев, проверка орфографии, метаразметка, расстановка языковых тэгов) и включение в корпус коми языка.
6. Добавление в молодцовский корпус текстов комиязычного номера газеты "Југыԁ туј" за 1923-11-28, включение данных текстов в переводе на современную графику в онлайн библиотеку "Коми гижӧд".
7. Пополнение словарной базы коми спелл-чекера hunspell новой лексикой из текстов, включенных в корпус коми языка в текущем месяце.
8. Возобновление работы по сравнению в программе Meld редакций прозаических текстов в целях устранения оставшихся после распознавания опечаток (повести Г. Юшкова).
9. Внесение исправлений в  словарь пейоративной лексики "Коми видчанкывъяс" на сайте Онлайн словари FU-Lab, работа со студентами-филологами СГУ по их участию в переводе иллюстративных примеров данного словаря.
10. Работа со студентами СГУ по их участию в созданий корпуса параллельных текстов (kv-ru) в части новостных публикаций портала rkomi.ru
11. Ознакомление слушателей курсов коми языка, проводимых в ГАУ РК "ДДН РК", с возможностями образовательного портала "Коми кыв" и других ресурсов, облегчающих освоение коми языка лицами, не являющимися его носителями.
12. Тестовое создание tmx-файла для разработки системы автоматизированного перевода.
13. Распространение комиязычного контента в соц. сетях.
14. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

2021ʼ йирымся отчётӧ FU-Lab-лӧн пай.

опубликовал Öньö Лав в 12:31 22.10.2021

2. Подготовка к созданию корпуса параллельных текстов (пара коми-русский):

2.1. Сборка, обработка, метаразметка и выравнивание в программе WinMerge текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за за 2012, 2015, 2016, 2019 гг. и январь-апрель 2021 г.

2.2. Сборка и обработка текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за за 2013, 2014 гг.

2.3. Выравнивание параллельных текстов на коми и русском языках в программе WinMerge по изданию П. Бажов "Сказъяс" (1953) и соответствующим русскоязычным публикациям.

3. Текстовое пополнение и техническая оптимизация Корпуса коми языка:

3.1. Извлечение из pdf файлов, обработка (выравнивание абзацев, проверка орфографии, метаразметка, расстановка языковых тэгов), перепроверка и включение в корпус коми языка текстов газеты "Коми му" (2021 №№39-42), журналов "Войвыв кодзув" (№№2-9 за 2021 г.) и "Йӧлӧга" (2021 №9).

3.2. Сборка, обработка (проверка орфографии, метаразметка, расстановка языковых тэгов), перепроверка и и включение в корпус коми языка текстов новостных порталов РК за август-сентябрь 2021 года и сайта "Изьватас".

3.3. Сканирование, создание pdf файла, распознавание, обработка (проверка орфографии, метаразметка, расстановка языковых тэгов), перепроверка и и включение в корпус коми языка текстов изданий: Зарни Люся. Шоныдін (2018), А. Шебырев. Фараон (2019)

3.4. Перепроверка и включение в корпус коми языка текстов нормативно-правовых актов РК за 2012, 2015, 2016, 2019, 2020 г.

3.5. Увеличение лимита выдачи результата до 10 000 единиц при поиске по фразе в корпусе коми языка.

3.6. Устранение случаев нестандартной кодировки в корпусе коми языка.

3.7. Решение проблемы неверной разбивки на предложения в корпусе коми языка (заглавная Ё в начале предложение, две заглавные в конце предложения, знак •, сочетание типа " Б. — "), а также проблемы с тегами <about>

3.8. Подключение виртуальной клавиатуры к корпусу коми языка

4. Текстовое пополнение и оптимизация молодцовского корпуса:

4.1. Добавление в молодцовский корпус коми текстов газеты "Југыԁ туј" за январь-октябрь 1923 года.

4.2. Добавление в молодцовский корпус текстов комиязычного номера газеты "Југыԁ туј" за 1923-11-24.

4.3. Разработка и подключение виртуальной клавиатуры к молодцовскому корпусу коми языка

5. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

5.1. Пополнение библиографии газетных и журнальных публикаций на коми языке: (газета "Коми му" №№12-39 за 2021 г., журнал "Йӧлӧга" №№2-12 за 2020 и №№1-8 за 2021 гг., журнал "Войвыв кодзув" №№2-9 за 2021 г.)

5.2. Пополнение библиографии книжных публикаций на страницах изданий: В. Е. Напалков. "Ӧттор-мӧдтор йылысь" (2021)", А. Шебырев. "Фараон" (2019), Людмила Втюрина. "Шоныдін" (2018) Г. Попов. "Мича гудӧк" (2017), создание гиперссылок к тем произведениям из данных изданий, которые размещены в онлайн библиотеке "Коми гижӧд".

6. Пополнение онлайн библиотеки "Коми гижӧд":

6.1. Размещение в коми онлайн библиотеке произведений автора Зарни Люся. Размещено 82 произведения из книжных изданий и 15 из журнальных публикаций.

6.2. Размещение в коми онлайн библиотеке произведений Г. И. Попова из издания "Мича гудӧк" (2017). Размещено 35 произведений.

6.3. Размещение в коми онлайн библиотеке текстов газеты Југыԁ туј за январь-ноябрь 1923 г. в переводе на современную графику.

7. Пополнение и модернизация сайта "Онлайн словари FU-Lab":

7.1. Обработка текста и разметка словаря пейоративной лексики коми языка "Коми видчанкывъяс" (2021), размещение содержимого данного словаря на сайте Онлайн словари FU-Lab

7.2. Разработка и подключение виртуальной клавиатуры к сайту "Онлайн словари FU-Lab"

8. Пополнение базы образовательного портала "Коми география":

8.1. Редактирование текстов по отечественной географии из коми учебников 1937, 1957 и 1959 гг. (разделы "территория и границы", "рельеф", "Дальний Восток"), размещение их на портале "Коми география".

8.2. Сканирование и распознавание изданий География Коми АССР. 7 класс (1987); География. 7 класс (2021), Коми - наш родимый край (2021) для пополнения текстовой базы ресурса "Коми география".

8.3. Работа по созданию аудиопрезентации по геологии Тимана на коми языке для сайта "Коми география".

9. Восстановление функциональности серверов ЦИЯТ после их отключения 8-10/Х-2021 г. и устранение возникших на сайтах проблем, связанных с перерывом в работе серверов.

10. Распространение комиязычного контента в соц. сетях.

11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

FU-Lab 18.10.2021–22.10.2021

опубликовал Öньö Лав в 10:39 22.10.2021

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 18.10.2021–22.10.2021.

  1. Продолжение сборки текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2014 гг. для дальнейшего редактирования, метаразметки и выравнивания.
  2. Обработка текстов официально-делового стиля (Постановления Правительства РК, Постановления Государственного Совета РК) на коми и русском языках из файлов БОП, содержащих НПА РК за за 2014 год для дальнейшего выравнивания.
  3. Обработка и выравнивание в программе WinMerge текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2015 год.
  4. Сканирование издания "Коми - наш родимый край" (2021), обработка сканов и создание ПДФ файла для дальнейшего распознавания.
  5. Редактирование текстов по отечественной географии из учебников 1937, 1957 и 1959 гг. (раздел "Дальний Восток"), размещение их на портале "Коми география".
  6. Извлечение и обработка текстов газеты "Коми му" (2021 №42) для включения в корпус коми языка.
  7. Включение текстов газеты "Коми му" (2021 №42) в корпус коми языка. Обновление корпуса.
  8. Добавление в молодцовский корпус и коми онлайн библиотеку коми текстов газеты "Југыԁ туј" за 1923-11-24.
  9. Решение проблемы с неверной разбивкой на предложения  в корпусе коми языка (заглавная Ё в начале предложение, две заглавные в конце предложения).
  10. Устранение случаев с нестандартной кодировкой в новых текстах, включенных в корпус коми языка.
  11. Разработка виртуальных клавиатур и их подключение к сайтам Онлайн словари FU-Lab, Корпус коми языка, Молодцовский корпус.
  12. Редактирование и разметка текста словаря пейоративной лексики "Коми видчанкывъяс" (2021) и его размещение на сайте Онлайн словари FU-Lab.
  13. Настройка удаленного доступа на компьютере Паршуковой А. А.
  14. Распространение комиязычного контента в соц. сетях.
  15. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
Лыдпасъяс

опубликовал Öньö Лав в 10:33 18.10.2021

Параллель нога официоз (визь - кылаин)

  • 2012 - 29 сюрс - 372 сюрс
  • 2016 - 36 сюрс - 460 сюрс
  • 2017 - 19 сюрс - 319 сюрс (радзьястӧг)
  • 2018 - 14 сюрс - 236 сюрс (радзьястӧг)
  • 2019 - 30 сюрс - 422 сюрс
  • 2020 - 42 сюрс - 536 сюрс
  • Ставнас - 170 сюрс - 2 315 сюрс

Параллель нога художка:

  • 90 155 визь

 

FU-Lab. 11.10.2021–15.10.2021.

опубликовал Öньö Лав в 17:54 14.10.2021

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 11.10.2021–15.10.2021.

  1. Сборка текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2013 и 2014 гг. для дальнейшего редактирования, метаразметки и выравнивания.
  2. Метаразметка и редактирование текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за за 2015 год для дальнейшего выравнивания.
  3. Выравнивание в программе WinMerge текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2016 год.
  4. Сканирование издания А. Шебырев. Фараон (2019), обработка сканов и создание ПДФ файла
  5. Распознавание в программе ABBYY FineReader издания, указанного в п. 4, метаразметка текста, исправление опечаток и ошибок; фиксация исправлений на соответствующей странице сайта "Коми тӧданін".
  6. Размещение произведений из издания Г. Попов. Мича гудӧк (2017) в коми онлайн библиотеке. Размещено 35 произведений.
  7. Создание гиперссылок на сайте "Коми тӧданін" к произведениям, указанным в п. 6.
  8. Работа по созданию аудиопрезентации по геологии Тимана на коми языке для сайта "Коми география".
  9. Редактирование текстов по отечественной географии из учебников 1937, 1957 и 1959 гг. (территория и границы, рельеф), размещение их на портале "Коми география".
  10. Обработка текстов журнала "Войвыв кодзув" (№№2-9 за 2021 г.) : выравнивание абзацев, проверка орфографии, метаразметка, языковые тэги, оформление на сайте.
  11. Извлечение и обработка текстов газеты "Коми му" (2021 №41) для включения в корпус коми языка.
  12. Включение текстов газеты "Коми му" (2021 №41), журнала "Войвыв кодзув" (№№2-9 за 2021 г.), издания А. Шебырев. Фараон (2019), а также НПА РК за 2016 г. в базу корпуса коми языка. Обновление корпуса.
  13. Добавление в молодцовский корпус коми текстов из номеров газеты "Југыԁ туј" за январь-октябрь 1923 года.
  14. Уточнение статистики по файлам основного корпуса.
  15. Восстановление функциональности серверов ЦИЯТ.
  16. Увеличение лимита выдачи результата до 10 000 единиц при поиске по фразе в корпусе коми языка.
  17. Решение проблемы с неверной разбивкой на предложения, связанных со знаком • и сочетанием типа " Б. — ", а также проблемы с тегами <about> в корпусе коми языка.
  18. Устранение бага с User warning на сайте audio.komikyv.ru
  19. Востановление доступа к интерфейсу разработчков интегрального словаря.
  20. Распространение комиязычного контента в соц. сетях.
  21. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
Октябрся проблемаяс

опубликовал Öньö Лав в 10:15 13.10.2021

  1. + Разбивка по • не происходит, если предыдущая строка заканчивается на закрывающую скобку ")". см. "Божков".
  2. + Не происходит разбивка и тогда, когда перед точкой имеются закрывающая скобка и прописная буква: "Владимир Уйба восьтіс Усинскын муниципальнӧй веськӧдлан шӧрин (МВШ). Арктикаса кар лоис республикаын Сыктывкар бӧрын мӧдӧн, кӧні заводитіс уджавны МВШ. Кӧч тӧлысь 7 лунӧ «Усинск» КК МЮ удж серти ветлігӧн Владимир Уйба тӧдмасис сылӧн уджӧн." (Коми Республикаса Юралысь ошкис Усинскса власьтъяслысь олысьяслӧн шыӧдчӧмъяс серти выль уджалан форматсӧ)
  3. + Вновь разбивка не происходит, когда предложение начинается с Ё: "— Республикаса Юралысь Владимир Викторович Уйбалӧн водзмӧстчӧм серти Веськӧдлан котыр лӧсьӧдіс врачьясӧс выезднӧй бригадалӧн уджӧ кыскӧм вылӧ торъя ыштӧдъяс. Ёнакодь содтӧма выезднӧй медицина специалистъяслысь удждон, вичмӧдӧма выезднӧй бригадаӧ кыскан квалифицированнӧй врачьясӧс патераӧн могмӧдӧм вылӧ сьӧм." (Коми Республикаса Веськӧдлан котыр примитӧ мераяс выезднӧй медицина служба сӧвмӧдӧм серти)
  4. + Количество словоформ в корпусе резко сократилось: с 69 580 337 до 66 489 192.
  5. + Необходимо продлить доменное имя komikyv.com (истекает 2021-11-01).
FU-Lab 04.10.2021–08.10.2021

опубликовал Öньö Лав в 16:48 11.10.2021

В общий отчет по  ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab  за период 04.10.2021–08.10.2021.


1. Сборка текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за за 2015 год для дальнейшего редактирования, метаразметки и выравнивания.
2. Сборка, редактирование и метаразметка текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за за 2016 год для дальнейшего выравнивания.
3. Редактирование, метаразметка и выравнивание в программе WinMerge  текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за январь-апрель 2021 года.
3. Выравнивание в программе WinMerge дополнительных текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за за 2012 год.
4. Сканирование изданий: География Коми АССР. 7 класс. 1987;  География. 7 класс. 2021; Зарни Люся. Шоныдін. 2018
5. Распознавание  в программе ABBYY FineReader  изданий: География Коми АССР. 7 класс. 1987;  География. 7 класс. 2021; Зарни Люся. Шоныдін. 2018; Зарни Люся. Олӧмлы ода. 2014.
6. Размещение произведений автора Зарни Люся в коми онлайн библиотеке. Размещено 82 произведения из книжных изданий и 15 из журнальных публикаций.
7. Создание гиперссылок на сайте "Коми тӧданін"  к произведениям, указанным в п. 6.
8. Работа по созданию аудиопрезентации по геологии Тимана на коми языке для сайта "Коми география".
9. Извлечение из pdf файлов текстов журнала "Войвыв кодзув" (№№2-9 за 2021 г.). Начало обработки данных текстов: выравнивание абзацев, проверка орфографии, метаразметка, языковые тэги, оформление на сайте
10. Извлечение/сборка и обработка текстов газеты "Коми му" (2021 №40), журнала "Йӧлӧга" (2021 №9), сайта "Изьватас" и актуальных текстов новостных порталов РК для включения в корпус коми языка.
11. Включение указанных в п. 10 текстов, а также дополнительных текстов НПА РК за 2012 г. в базу корпуса коми языка. Обновление корпуса.
12. Распространение комиязычного контента в соц. сетях.
13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

FU-Lab 27.09.2021–01.10.2021

опубликовал Öньö Лав в 16:48 11.10.2021

В общий отчет по  ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab  за период 27.09.2021–01.10.2021.

1.  Сборка текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2016 год для дальнейшего выравнивания.

2. Метаразметка и выравнивание в программе WinMerge текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2019 г. и 2012 г.

3. Выравнивание параллельных текстов на коми и русском языках в программе WinMerge по изданию П. Бажов "Сказъяс" (1953)  и соответствующим русскоязычным публикациям.

4. Подготовка текста издания Коми му_2021_№39 и актуальных текстов новостных порталов РК для включения в корпус коми языка.

5. Включение указанных в п. 4. текстов, а также текстов нормативно-правовых актов РК за 2019 г. в корпус коми языка; обновление корпуса.

6. Библиографирование издания "Ӧттор-мӧдтор йылысь (В.Е.Напалковлӧн 2021' вося небӧг)" и создание ссылок на страницах писателей в ресурсе http://wiki.komikyv.org.

7. Пополнение библиографии газетных публикаций на сайте "Коми тӧданін"
*газета "Коми му" №№12-39 за 2021 г.
*журнал "Йӧлӧга" №№2-12 за 2020 и №№1-8 за 2021 гг.

Иное:
Распространение комиязычного контента в соц. сетях.
Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

 

Проблемы после краха

опубликовал Öньö Лав в 20:01 10.10.2021

  • + Не открывается компьютер Катюши.
  • + Не связывается с Интернетом wi-fi fulab3
  • + При сохранении в папку КОМИПДФ, на изображении файла появляется замок. Открыть общий доступ не удается даже с основного компьютера.
Бара мытшӧдъяс

опубликовал Öньö Лав в 17:51 30.09.2021

  • (лимит повышен до 10 тыс.) В Корпусе коми языка при поиске по фразе стандартно выдает только 100 результатов.
  • + На audio.komikyv.ru на страницах с текстами появляется User warning.
  • + Интерфейс разработчиков интегрального словаря не открывается.
Выль мытшӧдъяс

опубликовал Öньö Лав в 10:36 14.09.2021

  • + Проблема с сертификатом безопасности для komikyv.org, komikyv.ru, komicorpora.ru
  • Не можем решить проблему разбивки текста в OmegaT.
  • + (Желательно сделать кнопку) В корпусе параллельных текстов БОП изъять весь контент, содержащийся между кавычками « » в следующих случаях:
    • на русском в сегментах:
      • "слова «» заменить словами «»"
      • "слово «» заменить словом «»"
      • "слова «» заменить словом «»"
      • "слово «» заменить словами «»"
      • "после слова «»"
      • "после слов «»"
      • "дополнить словами «»"
      • "дополнить словом «»"
      • "слова «» исключить"
      • "слово «» исключить"
    • на коми в сегментах
      • "«» кывъяс вежны «» кывъясӧн"
      • "«» кыв вежны «» кывйӧн"
      • "«» кывъяс вежны «» кывйӧн"
      • "«» кыв вежны «» кывъясӧн"
      • "«» кыв бӧрын"
      • "«» кывъяс бӧрын"
      • "«» кывъяс водзын"
      • "«» кыв водзын"
      • "содтыны «» кывъяс"
      • "содтыны «» кыв"
      • "«» кывъяс киритны"
      • "«» кыв киритны"
  • + Добавить виртуальную клавиатуру на Онлайн словари FU-Lab, дополнительные символы: ӓӝӟӥіҥӧӱӵӹ .
  • + В корпусе решить проблему разбивки в случае: "• Булатов И. Б. — Коми Республикаса Веськӧдлан котырӧн Юрнуӧдысьӧс Медводдза вежысь (Комиссияӧн веськӧдлысь)"
  • В корпус словарем поставить наш интегральный словарь.
  • Обновить орфографический модуль в FireFox.
  • Решить вопрос с поддержкой коми офрографии в Chrom, Edge и Opera.
  • Внедрить контекстный словарь в Opera.
Шойччан удж

опубликовал Öньö Лав в 13:27 07.08.2021

  • Роч да коми текст орччӧдігӧн казялӧм сорсьӧмъяссӧ (И., Л.) вежӧма корпусысь.
  • Ыджыд корпусӧ содтӧма Войвыв кодзув 1956 №7-12 (дасьтӧма И).
  • Ыджыд корпусӧ содтӧма Коми му да Йӧлӧга газетысь, парламент да юраланін сайтысь юнься да юлься гижӧдъяс, тестӧн замглавылысь контактса коми гижӧдъяс.
  • Небӧгаинӧ пуктӧм могысь кык файлӧ чукӧртӧма В. Л. Бабинлысь гижӧдъяс (везйӧдӧ И.)
  • Молодцов корпусӧ содтӧма гижӧдъяс 1920-22 вося коми газетъясысь (дасьтӧма ВН).
  • Молодцов корпусӧ содтӧма гижӧдъяс 1932ʼ вося небӧгъясысь: Мерајтӧмӧн пемӧсјаслыԍ ԍӧкта тӧԁмалӧм, Кроԉік віԇыԍјаслы інԁӧԁјас, Машіна ԏехԋіка паԍкалӧм, Віԇӧј вӧр сотчӧмыԍ, Кыԇі артмӧ бумага, Кыԇі вунԁавны ԁа такԍірујтны ԉесоԍекајас, Вӧр овмӧс мехаԋіԅірујтӧм, Кыԇі вӧчны бур піла, Вӧр уҗалан інструментјас, Вӧрхіміја јылыԍ, Ԏерпеԋԏін віјӧԁӧм Комі облаԍтын, Лӧԍӧԁам транспорт Комі облаԍтын соціаԉіԍԏіческӧј строіԏеԉстволы, Мыј лоӧ саԋітарнӧј міԋімум ԁа кыԇі сіјӧс нуӧԁны олӧмын, Ԋефԏ, Порԍ вӧԃітӧмын отсӧг, Ас вӧчӧм ԃеԏекторнӧј раԃіопріјомԋік, Ԃеԏекторнӧј пріјомԋік
  • Небӧгаинӧ содтӧма молодцовскӧй оригиналъяс: Мерајтӧмӧн пемӧсјаслыԍ ԍӧкта тӧԁмалӧм, Кроԉік віԇыԍјаслы інԁӧԁјас, Машіна ԏехԋіка паԍкалӧм, Віԇӧј вӧр сотчӧмыԍ, Кыԇі артмӧ бумага
  • Небӧгаинӧ содтӧма гижӧдъяс ӧнія да молодцов графикаӧн: Кыԇі вунԁавны ԁа такԍірујтны ԉесоԍекајас, Вӧр овмӧс мехаԋіԅірујтӧм, Кыԇі вӧчны бур піла, Вӧр уҗалан інструментјас, Вӧрхіміја јылыԍ, Ԏерпеԋԏін віјӧԁӧм Комі облаԍтын, Лӧԍӧԁам транспорт Комі облаԍтын соціаԉіԍԏіческӧј строіԏеԉстволы, Мыј лоӧ саԋітарнӧј міԋімум ԁа кыԇі сіјӧс нуӧԁны олӧмын. Водзджык юльын: Порԍ вӧԃітӧмын отсӧг.
New problems

опубликовал Öньö Лав в 12:42 05.08.2021

+ Заканчивается оплата имени komikyv.org.

Обновление Linux Mint

опубликовал Öньö Лав в 16:20 17.06.2021

+В Linux Mint накопилось множество обновлений, но они не устанавливаются.

Параллельные тексты

опубликовал Öньö Лав в 17:11 13.05.2021

+ Необходимо сделать маркерами конца предложения такие сочетания:
!.. ?..  !»  ...» ?» ... (два вида) ... — . —

Газеты нулевых

опубликовал Öньö Лав в 16:04 04.05.2021

Номера большинства коми газет до 2010 года не сохранялись как пдф, только .P65 (PageMaker). Нужен конвертер с этого формата в pdf для последующего экспорта текстового слоя.

Проблемы корпуса

опубликовал Öньö Лав в 19:11 01.05.2021

  • В корпусе не происходит разбивка в случае "). ". Пример при поиске по "морт" в "Медым судзсьымӧн овны / Kodko // Коми му (2021-05-27)".
  • +В корпусе проблема с инциалами. Происходит обрыв предложения по точке после каждого из инициалов.
  • +В корпусе рядом с кавычками «» искомое слово не выделяется красным цветом.
  • +В корпусе при сортировке по тексту в конце добавляются предложения с ―,  “,  •, …  . Их надо игнорировать.
  • +В корпусе не действуют исключающие теги <dict></dict> , <list></list>, их надо прописать туда, где <table></table>.
  • +В корпусе при сортировке не формат (2010-10-15 и 2010. №1) понимается как формат 2010 и соответственно по месяцу и дню сортировка не происходит. Желательно учитывать день и месяц, при этом 2010. №1 можно технически заменить на 2010-01-00 и т. д.
  • +Если в корпусе будет реализован предыдущий пункт, можно по умолчанию поставить результат поиска с сортировкой по дате в убывающем порядке (свежие даты - первые).
  • В корпусе не работает сортировка по источнику.
Апрель пом.

опубликовал Öньö Лав в 11:24 27.04.2021

  • +Надо новую версию портала на geography.komikyv.org
  • +Надо обновить Корпус коми языка
  • Коми войтыр: культура да история йылысь дженьыд серпаскывъяс (2008)-ын небӧгын абуӧсь чутікъяс.
Выль проблэмз

опубликовал Öньö Лав в 16:11 25.11.2020

  • +В корпусе предложения опять начали делиться по точке после инициала.
  • +В корпусе поиск по фразе не работает
По диалектному словарю

опубликовал Öньö Лав в 21:33 11.11.2020

  1. Цифирь
  2. В списке слов не отражается пробел между ex и ex_tr
  3. В списке оставлять только строчки с искомым словом, если не в заголовке.
  4. Вот здесь  в шестом пункте вместо "У.-И. пу розь" получилось "И. пу розь У.-". Это результат недоисправлений косяков на ранних этапах - в исходнике тот же косяк.
Вежонся удж

опубликовал Öньö Лав в 11:08 22.10.2020

  • 2020-10-16 Коми кыв корпусӧ содтӧма «Коми му» (2020), кывъяс спеллер кывкудйӧ.
  • 2020-10-18 Коми кыв корпусӧ содтӧма Адольф Туркин (1986), кывъяс спеллер кывкудйӧ (топонимъясысь ӧтдор).
  • 2020-10-19. Коми кыв корпусӧ содтӧма Святӧй Евангелльӧяс (1992). Рытнас волісны кык студентка аудио гижны (Елкина Светлана да Канева Эмилия). Драйвер жугалі. Лыдди налы лекция коми кывнас ӧнія ситуация кузя.
  • 2020-10-20. Коми кыв корпусын унифицируйтӧма небӧг пас ==n. Коми кыв корпусӧ содтӧма Нина Обрезкова (2017). Рытнас волісны кык студентка: Чупрова Олеся сканируйтіс Мишарин (2016) - колӧ выльысь вӧчны некымын лист бок, Трофимова Диана тексталіс 96 лист бок КЧА-1 (2009). Норасисны норма вылӧ.
  • 2020-10-21. Коми кыв корпусӧ содтӧма Вера Латышева (1995, 1997, 1999, 2012), кывъяс спеллер кывкудйӧ. Маршак небӧгаинысь босьтӧма «Бикиньяс» (1999-2004) сканируйтӧм могысь.
  • 2020-10-22. Коми кыв корпусӧ содтӧма Алексей Попов (1990, 1994, 2001, 2002, 2005, 2008, 2011, 2013). Рытнас сканируйтӧма 1999ʼ да 2000ʼ вося «Бикиньяс».
  • 2020-10-23. Коми кыв корпусӧ содтӧма Коми челядьлы антология (куимнан том), кывъяс спеллер кывкудйӧ. Спеллер кывкудйӧ содтӧма тшӧтш кывъяссӧ Обрезкова (2017)-ысь. Босьтчи вӧчны 1999ʼ вося Бикинь пдфкаяс.

 

Проблэмз

опубликовал Öньö Лав в 10:03 21.10.2020

В коми корпусе надо в исключения добавить <koi>.

В корпусе поиск по фразе осуществляется очень-очень медленно, а временами заканчивается безрезультатно.

В кратком коми-русском топонимическом словре не работают ссылки и синонимы (Междуреченск, Изьвавом).

Надо оплатить komikyv.com макхосту.

НИВХ ДИФ

опубликовал Öньö Лав в 11:07 08.10.2020

Йирым 5ʼ лунӧ вӧчим шыпаспӧв тэчасног нивхъяслы. Лунтыр выльмӧдім Коми кыв корпус.

Йирым 6ʼ лунӧ петіс уджавны Катюша. Содтіс Коми муяс да Йӧлӧгаяс. Ветлі Бикиньясла Маршак небӧгаинӧ.

Йирым 7ʼ лунӧ петіс уджавны Иннуш. Торйӧдалӧ быдмӧг-пемӧс зонаяс. Катюша сканераліс Сӧлӧ баб гижӧдъяса Би киньяс. Микӧ Вӧля вайӧдліс 6 студентӧс (4-ӧд курс), кутасны отсасьны миянлы (30 час: кыкӧн текстасясны, кыкӧн шыӧдасны кывъяс да куимӧн сканерасясны).

Йирым тан.

опубликовал Öньö Лав в 15:35 01.10.2020

Аттрибут "Орфографическая форма" перемещаем в раздел "Вариативность".
В раздел вариативность добавляем аттрибут "Орфографический вариант":

ВАРИАТИВНОСТЬ

ortho - орфографическая форма
ovar - орфографический вариант
ovarv
mvar - морфологический вариант
mvarv
fvar - фонетический вариант
fvarv
var - словообразовательный вариант (?)
varv

Выбор вариантов:

 

Сентябр пом

опубликовал Öньö Лав в 18:55 30.09.2020

По браузерному словарю: в wiki-инструкции сделали ссылку на магазин расширений Microsoft Edge.

По интегральному словарю: из списка незафиксированных в словарях слов удалены лексемы, присутствующие в диалектном двухтомнике; в онлайн инструментах появилась возможность поиска по xml-ке; стало отражаться её название; создана возможность добавлять и удалять статью; в новых словах обеспечено сохранение аттрибутов.

По латинской раскладке: в версии для Windows заменили нестандартный дефис стандартным (U+2010 > U+002d).

По словарю dict.komikyv.ru

опубликовал Öньö Лав в 9:16 12.08.2020

По мнению пользователей, при поиске не надо учитывать регистр.

Яндекс.Метрика