Пятница

опубликовал admin в 16:29 08.11.2019

В контекстном словаре частично переписан алгоритм. Реализована возможность отображения атрибутов onlyin, pos, dial 

Инвентаризация

опубликовал admin в 16:27 07.11.2019

Проведена частичная инвентаризация оборудования ДДН

Пятница!

опубликовал admin в 13:53 01.11.2019

1. Написан "Большой этнографический диктант"

2. В corpusV3 исправлен поиск по подкорпусу

3. Первичная реализация выделения поискового запроса (пока без постраничной навигации)

CorpusV3

опубликовал admin в 14:59 30.10.2019

Добавлена функция поиска по фразе

CorpusV3

опубликовал admin в 10:49 29.10.2019

Введен конфигурационный файл (config.ini)

Ботаника

опубликовал Öньö Лав в 16:59 28.10.2019

Шойччан лунъясӧ ударнӧя вӧлі помӧдз тексталӧма да спеллералӧма латынь шыпасъяса Ботаника_1934.

CorpusV3

опубликовал admin в 14:09 28.10.2019

1. Доработан механизм расширения конткста, теперь не расширяется контест у первого и крайнего предложения, в соответствующую сторону

2. Добавлена статистическая информация "Всего словоупотреблений"

3. Добавлен механизм сохранения переносов

CorpusV3

опубликовал admin в 16:41 22.10.2019

1. Добавлена возможность выбора порядка сортировки

2. Добавлены отрицательные фильтры

Понедельник день тяжелый

опубликовал admin в 12:58 21.10.2019

1. MongoDB обновлено до версии 4.2.1

2. Доработан парсер corpusV3 (в части вставки в БД)

3. В corpusV3 добавлены фильтр и сортировка по источнику

4. В corpusV3 добавлена защита от поиска значения, длина которого 1 символ

CorpusV3

опубликовал admin в 14:57 18.10.2019

Частично реализована сортировка по году, автору и названию 

Среда

опубликовал admin в 17:23 16.10.2019

1. Разгребли косяки в метаразметке корпуса (в части информации о произведении).

2. В corpusV3 добавлена возможность поиска по году

3. В komikyv.ru добавлена адаптация высоты с учетом шапки браузера (мобильная версия)

Вторник

опубликовал admin в 11:28 15.10.2019

1. Исправлены косяки оформления мобильной версии на komikyv.ru

2. Добавлена возможность поиска по лемме в corpusV3

Молодцов кадся текстъяс + Раскладкаяс

опубликовал Öньö Лав в 18:11 11.10.2019

Тайӧ вежон чӧжӧн

Спеллералӧма:

  1. Жеребцов_1928_vo
  2. Корнилов_1932
  3. Молчанов_1933
  4. Попов_1932_fizika_2
  5. Сигрианскӧй_1932

Открыты пользователям новые версии наших раскладок, добавлены изображения вариантов раскладки для  марийского и удмуртского.

 

Корпус v3

опубликовал admin в 12:01 11.10.2019

Добавлена постраничная навигация

Корпус v3

опубликовал admin в 15:49 10.10.2019

1. Доработка поисковой системы. Введены 2 критерия поиска: автор и название

2. Начата разработка скрипта по формированию списка реальных словоформ

Отпуск

опубликовал Öньö Лав в 9:32 10.10.2019

Шойччигмоз тексталі да спеллералі Молодцов пасъясвыв спец. гижӧдъяс:

  1. Бабушкин_1932
  2. Бахлутская_1932
  3. Габов_1932
  4. Данилов_1932_jmtf
  5. Данилов_1932_zmk
  6. Ефимов_1931
  7. Жданов_1933
  8. Инсаров_1933
  9. Крыленко_1927
  10. Майбыров_1932
  11. Митюшев_1932
  12. Москалёв_1931
  13. Надеева_1933
  14. Позднев_1933
  15. Преображенской_1932
  16. Сабинин_1933
  17. Селезнёв_1932
  18. Шахов_1932
  19. Шендеров_1933
  20. Шиперович_1932
  21. Якубюк_1932

Тексталӧма (спеллеравтӧг) Молодцов шыпасъясвыв гижӧдъяс:

  1. Жеребцов_1928_vo
  2. Корнилов_1932
  3. Молчанов_1933
  4. Попов_1932_fizika_2
  5. Сигрианскӧй_1932

Коми латыня гижӧдысь тексталӧма да спеллералӧма:

  • География_3_1933

Коми латыньын спеллеравсьӧ:

  • Ботаника_1934
  • География_4_1933

 

Правки..

опубликовал Дмитрий Левченко в 11:38 23.09.2019

1. В молодцовском корпусе исправлена проблема поиска коротких слов

Komi spellchecking dictionary

опубликовал Дмитрий Левченко в 15:01 18.09.2019

Разработан и успешно добавлен в магазин расширений mozilla плагин для проверки орфографии на коми языке

Исправление проблем

опубликовал Дмитрий Левченко в 10:10 17.09.2019

1. В корпусе исправлена работоспособность функции поиска "Как часть слова" - "Только в начале слова"

2. Начата разработка новой версии программы проверки орфографии для браузера Mozilla Firefox

Понедельник..

опубликовал Дмитрий Левченко в 15:32 16.09.2019

1. Доменные имена на ..2.238 имеют теперь самоподписанный сертификат. Доменные имена:

audio.komikyv.ru, courses.komikyv.ru, dict.komikyv.org, dict.komikyv.ru, komikyv.com, komikyv.org, komikyv.ru, m.komikyv.org, school.komikyv.ru, vidzanin.komikyv.com, wiki.komikyv.com, wiki.komikyv.ru, wiki.komikyv.org, words.komikyv.ru

2. Обновлена прошивка mikrotik до версии 6.45.6

3. Для fu-lab.ru разработан новый инструмент "Сортировка по алфавиту с конца слова"

4. Добавлена админка для webspell.fu-lab.ru

Падмӧдъяс

опубликовал Öньö Лав в 18:29 14.09.2019

  • Вӧчи кык содтӧд спеллер: 1. дженьдӧдӧм + вариатив. Сэтчӧ пырті бара еч, ича, нньӧ, ттьӧ, лльӧ, йӧ кывъяс. 2. Артмӧм списокысь чинті вариатив - артмис куш спеллер.
  • В спеллер-онлайн желательно создать админку.
  • Надо бы всё-таки выяснить вопрос со словарями спеллера в браузере.
  • В корпусе перестала работать функция "Как часть слова" - "Только в начале слова".
  • В молодцовском корпусе не решена проблема кратких слов.
256

опубликовал Дмитрий Левченко в 13:36 13.09.2019

1. McHost переведен на бесплатный аккаунт, халява рулит.

2. Backend контекстного словаря удален из-за громоздкости. Начал писать с нуля..50% load, ждём v2.0

3. Написано несколько скриптов на python для сбора статистических данных и данных по словарным статьям. Подопытными в работе скриптов были корпус коми языка, *.dic и большой коми-русский словарь

Вежам тегъяс

опубликовал Öньö Лав в 12:50 13.09.2019

В файлах словаря dict_komi-rus_org.xml проводятся следующие работы (EL & INA):

  • пустые статьи со ссылками заполняются контентом из статей, на которые идут ссылки. В дальнейшем в большинстве случаев link будет преобразован в syn.
  • омонимы объединяются в один <line>.
  • вводится атрибут onlyin для слов, встречающихся только во фразе. Такие фразы выводятся в отдельные словарные статьи.
КЫК ПӦВ?

опубликовал Öньö Лав в 10:35 13.09.2019

На текущей неделе проделаны следующие операции по усовершенствованию корпуса словаря dict_komi-rus_org (32 852 лемм) и словарной база hunspell komi.dic.

  1. Из списка hunspell komi.dic (298541 лемма) исключены вариативные формы, в komi.dic осталось 278867 лемм.
  2. Сокращенный таким образом список komi.dic (278867 лемм) соотнесен с полным списком словоформ, представленных в корпусе коми языка, в результате чего из  списка komi.dic изъяты все искусственные формы (личные имена и производные глагольные формы). В полученном файле komi_out.dic осталось  130976 лемм.
  3. Из файла komi_out.dic выведены в отдельные файлы личные имена и русские заимствования. Остаток, получившийся после изъятия указанных групп лемм, записан в файл komi_out_short.dic, включающий 62431 лемму.
  4. Проведено сравнение списка лемм словаря dict_komi-rus_org (32 852 лемм) со списком лемм файла komi_out_short.dic, в результате получен файл komi_out_short_out_dictionary.dic, который содержит 41318 лемм, представленных в komi_out_short.dic, но отсутствующих в словаре dict_komi-rus_org.
  5. Следовательно, в словаре dict_komi-rus_org должно присутствовать 11739 лемм, не попавших в список komi_out_short.dic. Вероятно, это русские заимствования, исключенные из файла komi_out.dic на этапе 3.
  6. По факту при изъятии из файла  dict_komi-rus_org лемм, имеющих соответствия в komi_out_short.dic, там осталось 12763 леммы, результат записан в файл  dic_komi_rus_xml_only.

Все названные файлы находятся в видзаніне в папке dic_aff.

Выльлун - сьӧкыд лун

опубликовал Öньö Лав в 22:38 09.09.2019

  • Катя муніс шойччыны, ме эг мун.
  • Лена ноксис нестандартнӧй лексикаӧн; содтӧд вӧчӧ кык лыддьӧг: 1) стандарт кыв абу миян дикын, 2) кывйыс мыйлакӧ абу корпусын.
  • Иннуш лӧсьӧдіс syn-яс, сэсся юнься "Югыд туйяслы" вӧчис метаразметка; пуктім сылы универсальнӧй коми раскладка.
  • Ми Димакӧд видлім мездысьны нумерацияысь, вӧчим вӧлись маркируйтӧм лыддьӧг (оз на тыдав ме компын).
  • Ме тӧрыт-талун тексталі 4-ӧд класслы 1935ʼ вося "Естествознание" да текстуйті  Англия йылысь 1934ʼ вося Географияысь (6-ӧд класс), сюри унакодь выль термин: васӧдӧм "орошение", вӧчас "продукция", васӧд "влага", косін "суша", вапукаланін "водоем", торъялӧм "особенность", уджалан кӧлуй "оборудование", сісьмӧг "перегной", кыкмындаавны "удвоить", сюрсалыа "позвоночный", сюрсалытӧм "беспозвоночный", сюрсалы "спинной мозг", ловйӧн вайысь "живородящий", гагсёйысь "насекомоядное", йӧлӧн вердчысь" млекопитающее"...
  • Марина вӧзйис нацбиблиотекалы цифруйтны коляс небӧгъяс 1920-30 воясысь.
  • Последовательность работы при пополнении словаря леммами из hunspell: 1. Устранить в komi.dic все глагольные леммы, которые не имеют соответсвующих форм в корпусе; 2. Вывести списком все леммы, которые есть в komi.dic, но нет в словаре.
Понедельник день тяжелый

опубликовал Дмитрий Левченко в 17:54 09.09.2019

1. Доработан вывод частей речи в контекстном словаре (в link)

2. Нумерованный список переделан в маркированный

3. Добавлены новые визуальные отступы

4. Обновлена прошивка mikrotik до версии 6.45.5

Дыш пекнича

опубликовал Öньö Лав в 13:28 07.09.2019

  • Тӧрыт видлалім К. Ленакӧд, кыдзи интегрируйны кывкудйӧ вариативнӧй леммаяс. Быд вариант весьтӧ лоӧ пуктӧма гижӧд кывса лемма. Быд кывлысь вежӧртас колӧ стӧчмӧдавны корпус серти.
  • Катя водзӧ лӧсьӧдіс 2008ʼ вося Коми муяс.
  • Инна метааліс 1929ʼ августся Югыд туйлысь гижӧдъяс.
  • Ачым текталі Югыд туй, тайӧ вежонся нумер-мӧд.
  • Гижӧдчи Кутш керкаса став петас вылӧ 2020ʼ во кежлӧ.
  • Видлалӧм могысь мӧдӧді Ӧ. Насталы 1929ʼ мӧд во джыся "Ордым"  номеръясысь мол. текстъяс.
Чеԏверг

опубликовал Öньö Лав в 11:37 05.09.2019

Инна помаліс лӧсьӧдны 1960ʼ вося "Войвыв кодзув". Босьтчис метаавны 1929ʼ августся "Югыд туй".

Леналӧн метаавсис 1929 вося "Ордым"  (№№1-9).

Выявились проблема со ссылками в словаре. Дабы избежать введения тройного слоя в словарной статье летом были устранены рубрикации типа "1)", а ссылки остались прежними. При этом в тестовом плане были реализованы два решения тройного слоя: 1. разделить на отдельные словарные статья (омонимы) наречия и послелоги, 2. ввести рубрикацию типа 2.1, 2.2. В конечном итоге победил второй подход. Но в рамках реализации первого были уже проведены некоторые изменения. Сегодня  такие случаи были унифицированы по второму принципу. Далее надо переработать ссылки.

Сӧвет

опубликовал Öньö Лав в 12:48 04.09.2019

Переводчики подсказали по проблеме "link": в случае ссылки на основное слово в словаре употреблять фразу  "вариант слова ...".

При главном слове добавить "Вариативные формы:"

Синонимы - это отдельный случай.

Лена сетіс экзамен вит вылӧ.

Босьтчи тэчасавны молодцов дикын 1920ʼ воясысь чукӧртӧм лексика.

Лӧсьӧді коми программаяс да мый да Сыктывкарса 1№-а школаысь коми велӧдысь Педӧр Леналы.

Правки

опубликовал Дмитрий Левченко в 15:03 03.09.2019

Контекстный словарь:

1. api.fu-lab.ru перенесен на основной сервер ..2.238

2. Добавлен поиск слов с дефисом по точному совпадению и с нахождением леммы

3. Частично реализован функционал с атрибутом "link"

4. Введен класс myMongo

Яндекс.Метрика