[Dict] БГ Офис модул за проверка на правопис
Sah War
ve4ernik at gmail.com
Mon Apr 13 17:14:54 EEST 2015
@Михаил Балабанов
„Накратко, според мен за нашата съвсем тясна и конкретна приложна задача –
> формообразуване на конкретен, ограничен и предварително известен списък от
> думи – подходът с правилата е много удобен (от човешка гледна точка) и
> ефективен (от техническа гледна точка), а напротив, боравенето с „плосък“
> списък от милиони словоформи в един файл би било изключително неудобно и
> тромаво.“
Да, съгласен съм с мнението ви, именно това имах предвид като казах
„Но иначе за целите на „БГ Офис“ (които са основно в областта на проверката
> на правописа и само донякъде и на граматиката), мнението ви е напълно
> валидно, г-н Балабанов.“
>
:) Все пак е възможно да има и второстепенна по важност версия, която да е
като „плосък“ списък. :D
„Не виждам пречка да обединя тази класификация със сегашната в БГ Офис,
> защото вероятно моите промени са еквивалентни на тези, извършени от
> останалите клонирали екипи.“
>
Да, добра идея е. И аз имам няколко предложения за някои добавки към
класификацията — от следния адрес можете да видите настоящите ми дейности
по този въпрос:
http://slovnik.chitanka.info/%D0%A1%D0%BB%D0%BE%D0%B2%D0%BD%D0%B8%D0%BA:%D0%91%D1%8A%D0%BB%D0%B3%D0%B0%D1%80%D1%81%D0%BA%D0%B8/%D0%A2%D0%B8%D0%BF%D0%BE%D0%B2%D0%B5_%D0%B4%D1%83%D0%BC%D0%B8
.
„Например в моята класификация съм разделил правилата за глаголите на
> такива от свършен и несвършен вид, защото първите не трябва да образуват
> деепричастия, сегашни деятелни причастия и отглаголни съществителни
> (*нарисувайки, *нарисуващ, *нарисуване).“
>
Да, хубаво е да се разделят на такива от свършен и на такива от несвършен
вид.
„Може би може да се отделят и преходните глаголи от непреходните заради
> страдателните причастия (за да няма неща като *постоян), но за целите на
> правописната проверка те могат да се изнесат при прилагателните.“
>
И в моята версия на класификацията съм разделил преходните и непреходните
глаголи. Подкрепям това предложение. Най-добре е да са като нов (под)тип
към прилагателните, да.
Мисля, че ще е най-добре да съберем каквито промени са направени по
класификацията (от теб (г-н Балабанов), от IDI в IDI Spellchecker, от мен —
и ако има и други — и останалите) и да ги реализираме.
„ПП Като лингвист, може ли да хвърлите един поглед на
> https://sites.google.com/site/bglocalize/ ? Бих се радвал на всякакви
> конструктивни коментари. :)“
>
Благодаря за гласуваното доверие като лингвист, но съм по-скоро филолог,
който още не е завършил университетското си образование. ;-))) Но се
занимавам дейно с езикознание като хоби. :) От години ползвам BGlocalize.
:) Много добър ресурс, през годините съм събрал някоя и друга дузина с
допълнения към терминологичния ви речник (и даже направих и следната
<http://slovnik.chitanka.info/CBASTILS> компилация на материали по темата,
която засега е просто копие на BGlocalize), ако искате, мога да ви ги
изпратя или направо да ги обсъдим насаме в отделна, частна кореспонденция
по ел. поща. :) От над 1-2 години се влачи един мой проект, свързан с
BGlocalize, пишите ми, за да обсъдим и него, ако се интересувате. ;) Също
така приветствам и нови попълнения към екипа на моя проект „Бълогос
<http://slovnik.chitanka.info/%D0%9D%D0%B0%D1%87%D0%B0%D0%BB%D0%BD%D0%B0_%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D0%B0>“,
разгледайте алфа-версията ( :D ) на уебсайта на част от проекта и ми
пишете, ако се интересувате и от това. :)
Поздрави,
Sah War (sahwar)
На 10 април 2015 г., 17:23, Mikhail Balabanov <mishob at abv.bg> написа:
> @Sah War:
> Занимавам се с компютърна лингвистика и машинен превод повече от 15 г.,
> макар и само като хоби, а освен това имам и добър поглед „от другата
> страна“ като преводач, редактор и автор, така че разбирам напълно за какво
> става дума. [1] :) Изобщо не говоря за цялостна формализация на естествен
> език – прагматика, семантика, пък дори и синтаксис. Говоря само за
> формообразуване, при това само в посока генериране на форми, без същински
> морфологичен анализ, без парсинг и извличане на граматични признаци.
>
> Използваният конкретно от БГ Офис набор от правила е базиран доста тясно
> на книга, издадена през 80-те години, която за времето си е била
> революционен начин на представяне. Класификацията обаче не е била
> предвидена за компютърна обработка, която изисква пълна прецизност (не
> просто висока, а именно пълна). Т.е. _замисълът им_ наистина е да обхващат
> абсолютно точно парадигмите на формообразуване _за всички думи, включени в
> речника за проверка_ (не за всяка мислима българска дума!), за което в
> текущия си вид се нуждаят от доработка, но става въпр
> ос за сравнително проста работа. Например в моята класификация съм
> разделил правилата за глаголите на такива от свършен и несвършен вид,
> защото първите не трябва да образуват деепричастия, сегашни деятелни
> причастия и отглаголни съществителни (*нарисувайки, *нарисуващ,
> *нарисуване). [2] Имам и други допълнения и в крайна сметка съм получил
> доста функционален набор от правила, който не допуска никакви грешки _за
> думите, включени в речника_. Не виждам пречка да обединя тази класификация
> със сегашната в БГ Офис, защото вероятно моите променÐ
> ¸ са еквивалентни на тези, извършени от останалите клонирали екипи.
>
> Накратко, според мен за нашата съвсем тясна и конкретна приложна задача –
> формообразуване на конкретен, ограничен и предварително известен списък от
> думи – подходът с правилата е много удобен (от човешка гледна точка) и
> ефективен (от техническа гледна точка), а напротив, боравенето с „плосък“
> списък от милиони словоформи в един файл би било изключително неудобно и
> тромаво.
>
> Поздрави,
> Михаил Балабанов
>
> ПП Като лингвист, може ли да хвърлите един поглед на
> https://sites.google.com/site/bglocalize/ ? Бих се радвал на всякакви
> конструктивни коментари. :)
>
>
> [1] …и изобщо не бих противопоставял „традиционната“ и
> компютърната/математическата лингвистика. Всеки компютърен лингвист би
> трябвало да е наясно, че поставена в общия случай, задачата е нерешима, и
> когато се разработва формализъм или се пише софтуер, винаги се търси
> ефективно и прецизно решение за някакъв приложен частен случай.
>
> [2] Може би може да се отделят и преходните глаголи от непреходните
> заради страдателните причастия (за да няма неща като *постоян), но за
> целите на правописната проверка те могат да се изнесат при прилагателните.
> При мен е необходимо да се смятат за форми на глагола за по-удобно
> реализиране на машинния превод.
>
> _______________________________________________
> Dict mailing list
> Dict at ludost.net
> http://lists.ludost.net/cgi-bin/mailman/listinfo/dict
>
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.ludost.net/pipermail/dict/attachments/20150413/c4fa06e8/attachment-0001.html>
More information about the Dict
mailing list