Спеллер, ты не прав!

реклама
Спеллер, ты не прав!
Лавошникова Элина Константиновна – ведущий
программист Лаборатории автоматизированных
лексикографических систем Научно-исследовательского
вычислительного центра МГУ им. М. В. Ломоносова.
http://www.lcl.srcc.msu.ru
О «ПОДВОДНЫХ КАМНЯХ» В СИСТЕМАХ ПРОВЕРКИ
ПРАВОПИСАНИЯ
В век компьютерной грамотности не все могут похвастаться
грамотностью обычной, знанием родного языка.
В редактор MICROSOFT WORD встроен так называемый
автокорректор или спеллер ОРФО - система проверки
правописания.
В версии WORD2000 используется тот же спеллер, что и в
версии 1997 года. Очевидно, был сделан вывод, что этот
автокорректор уже достаточно хорошо работает, подчеркивает
слова, отсутствующие в его словарях (подозреваемые в
орфографической некорректности), подчеркивает
неправильные синтаксические конструкции, а также следит за
стилем.
Стилистика - дело тонкое. Начнем с орфографии.
При поверхностном тестировании оказалось, что считаются
правильными, т.к. имеются (порождаются) в словаре
автокорректора ОРФО, следующие словоформы и
конструкции:
«вскоре» и «в скоре»,
«подражать» и «подрОжать» (от слова «дрожать»),
«пародировать» и «парАдировать» (от слова «парад»),
«адаптация» и «адОптация»,
«(пере)платить» и «(пере)плОтить» (от слова «плот»),
«(по)щипать» и «(по)щЕпать» (откалывать лучину),
«халява» и «хОлява»,
«летчик-ас» и «летчик-асс».
Список таких пар может быть продолжен. Как тут не смутиться
не слишком искушенному во всех тонкостях лексикографии
пользователю? Причина этого «плюрализма» перенасыщенность словарей спеллера редко употребляемыми,
узкоспециальными и устаревшими словами, которые, как
подводные камни, могут сбить с пути истинного и привести к
пропуску ошибок. Подобные лексемы в академических
словарях часто имеют соответствующие пометы. Так, в
«Грамматическом словаре русского языка» А.А. Зализняка к
существительному «скора» дается примечание - старин.,
собир.: шкуры (поэтому «в скоре» должно означать «в
шкурах»);
к термину «адоптация» - дано толкование принятие;
к слову «холява» - стеклянный цилиндр; голенище;
к слову «асс» - древнеримская монета.
Есть и прямые ошибки. Одна из самых досадных - спеллер
ОРФО не склоняет слово «ходы» во множественном числе,
подчеркиваются красной волнистой чертой как неправильные
словоформы «ходов», «ходам», «ходами», «о ходах».
Чтобы убедиться, что работа спеллера пока еще оставляет
желать лучшего, см. ниже специально придуманные
предложения с разрезаниями слов, со «склеиваниями», с
пропуском букв и с другими ошибками.
Исполнит ель роли мушке тера, тяготе я к такой мелю зге,
како нем пишут, пьет кофе, како и не пьет сов сем вы питый
всеми сам огон.
Это маклерили не маклер? Дав ай пеш ком! По чему он
неводит машину, паль чик порез ал? Кош мар! Пуск ай
полчеса пол ежит в посте ли.
О како избрани и настоя теля администрациею намек али, хоте
ли, чтобы не было беремени иль за силья земно власти?
Не жалей воженных (sic!) в тех ник ум денег, чтобы эти не
вежи и не вежды не голод али. Им купно повезло, живут
норма ль но, про сторно, не занимаются убор кой двор а и не
плотят затепло.
В се население с ада (детского сади-ка) умы-то и оде-то.
Закраем села, о коло золотист ого по ля нетям и кочек, но
нети указ-теля лев ого по ворота, нети ни одного пеше хода,
до рога идет под ук лон.
У захваченных после военных манеров (sic!) язы ков с
победным клико забрал и всеоружие, абой продол жался.
Усовершенного на падения были свои ре зоны.
Четы ре строи теля иск али для своей певче лас точки ж уков.
Это не бай-ка. На нарты села лай-ка. Г де сказа но? В газе те
«Прав-де».
Кто там, за клуб никой? Яко всем обращаюсь! Отвеет (sic!):
Ник то! Конь в паль-то! Запря гай! Это плотни к. Гон и гран
ату!
Низенька лошадка с никою леди на ней, часто спотыкаясь и
бременами падя, проиграла мара фон, ус какала на никое
пастбище в доли ну и в скоре уже мирно паслась.
На ре петиции пи онерам пришлось повтор ять в се дев ять
раз.
Мы возьмут или они купите один т орт, не од ну колба су, а
много колба-с, кур агу и л ук.
Эти умненьки кандидаты на ук или доктора неук? Как раз де
лить на всех умни ков и ум ниц эту бум агу? Надо ее пря тать
в фон-де.
Так ой ин вари ант прим ера мы б ерем за основу.
Вот тебе ук аз: пи-ар перед полным зало стили зуй, г ерой!
Ежь не глад кий, пре мудрое млеко питающее, с лон тебя не
пре взойдет и не пре одолеет!
Никаких возражений по стилю или синтаксису к таким
«высказываниям» со стороны автокорректора ОРФО! Нет
подчеркиваний красной волнистой чертой, т.к. все эти слова
(от пробела до пробела) имеются в основном словаре
спеллера, нет и подчеркиваний зеленой волнистой чертой предупреждений о синтаксических или стилистических
ошибках. Далее будет показано, почему автокорректор не
всегда хорошо выполняет свои функции.
Посмотрим еще примеры, которые могут получиться в
результате довольно распространенного «технического брака»
- разрезания слова на две части. Особенно часто это
случается при сканировании или при переносе слов, когда
знак переноса по невнимательности пользователя пропадает
или наоборот - дефисом разбивается слово, а также при
случайном нажатии клавиши пробела. Спеллером ОРФО
пропускаются такие разбиения:
«нормали зуем», «централи зуя», «детали зую» («зуй» птица),
«дат чик», «счастлив чик», «та кой», «так се»,
«граждан ин», «груз ин», «уж ин» («ин» - частица),
«лжи вый», «пер вые» («выя» - шея),
«ник уда», «с удов», «не удов» («уд» - член тела),
«придел али», «запуск али» (примеров с союзом «али» очень
много),
«пот ерь», «изб ерем», «прим ерь» («ерь» - мягкий знак),
«с ерой», «акт ер», «танк ера», «зам ерами» («ера» - гуляка),
«кассир ша», «юно ша» («ша» - и название буквы, и
междометие),
«две рцы», «то рцы», «ста рцы» («рцы» - старое название
буквы «р»).
В русском языке имеются такие пары паронимов (одинаково
звучащих в нормативном произношении слов, пишущихся поразному), которые трудно разграничить (развести) по их
частотности или сферам употребления. Примеры: «кОмпания»
и «кАмпания», «полОскать» и «полАскать». Сюда же можно
было бы отнести пары: «прИтворять(ся)» и «прЕтворять(ся)»,
причастия - «замешАнный» (от глагола замешать) и
«замешЕнный» (от глагола замесить) и т.д. Кстати, от более
чем странного глагола «замешкать», имеющегося в словаре
спеллера ОРФО, он образует (считает правильными) также и
причастия - «замешканный» и «замешкавший». Мало того, от
редкого глагола «замшить» (обложить, покрыть мхом)
образуется еще и причастие «замшенный», которое скорее
может получиться в результате пропуска гласной «е» в слове
«замешЕнный».
В следующих версиях текстового редактора хорошо бы
завести также и словарь паронимов.
Есть в русском языке пара очень похожих высокочастотных
глаголов «представлять» и «предОставлять». Здесь человеку
приходится быть внимательным и не путать одно с другим.
Еще пример: если во фразе «он преДставился» пропустить
букву «д», то получится совсем нехорошо - «он преставился».
Но чаще возникают такие ошибки в написании глагольных
форм, пропуск которых спеллер мог бы помочь избежать.
Если в словах «предложить», «предложивший»,
«предложенный», «предлагать», «предлагающий»,
«предлагаемый» случайно пропала буква «д», а в словах
«приложить», «приложивший», «приложенный», «прилагать»,
«прилагающий», «прилагаемый» ошибочно вместо «при»
набрано «пре», то спеллер ОРФО таких ошибок не заметит,
т.к. в его словаре имеются малоупотребительные глаголы
«преложить» и «прелагать».
В словарях автокорректора представлены и другие столь же
редкие глаголы, например, «слонять», «впивать», «впить»,
«запреть», «пхать», «узить», «подрежать», «подредить»,
«выяснеть», «прообразовать», «сбирать» и «сбираться» (Как
ныне сбирается вещий Олег отмстить...). Такие глаголы и
образуемые от них причастия («слонявший», «слоняющий»,
«слоняемый», «впиваемый» и т.п.) в реальных текстах
пользователя скорее могут появиться в результате пропуска,
замены или перестановки букв в более употребительных
словах. Однако это не вызовет никаких замечаний со стороны
данной версии системы ОРФО. В словаре спеллера
порождаются также и такие словоформы: «пию», «пиет»,
«пиешь», «пием», «пиете», «пиют», атакже причастие
«пиющий». Имеется столь же странный глагол «усовершить».
В словаре автокорректора ОРФО имеются слова «всеоружие» и
«нети», которые с большой вероятностью могут получиться в
результате склеивания при невнимательном редактировании
текста. Словарь А.А. Зализняка к заглавному слову статьи
«всеоружие» после двоеточия приводит выражение «во
всеоружии», а к слову «нети» выражение «в нетях».
Двоеточие означает, что слово употребляется только в
приводимом сочетании и, следовательно, не существует таких
словоформ, которые авторы спеллера ничтоже сумняшеся
произвели: «всеоружие», «всеоружия», «всеоружию»,
«всеоружием», «нети», «нетей», «нетям», «нетями» и т.п.
Из оборота «ни зги не видно» они же произвели следующие
словоформы, которые в современном русском языке не
употребляются: «зга», «зге», «згой», «згою», «згам», «згами»
и т.д. К слову «ляд» в словаре А.А.Зализняка после двоеточия
дается выражение «на кой ляд». Это значит, что слово
употребляется только в этом сочетании. Но спеллер его
склоняет: «ляда», «ляду», «лядом», «о ляде». Из оборота
«никоим образом» в ОРФО порождаются и считаются
корректными словоформы «никой», «никоя», «никое»,
«никои», «никоего», «никоей», «никоих», «никоему»,
«никою», «никоем», «никоею», «никоими».
Хотелось бы высказать еще такое пожелание. Фразеологизмы
(устойчивые обороты) можно было бы распознавать по
контексту и обрабатывать особым образом. Пока что спеллер
ОРФО выдает подчеркивания красным (претензии к
орфографии) в конструкциях: «притча во языцех», «вынь да
положь» (им признается только нормативная форма
повелительного наклонения «положи»), «ничтоже
сумняшеся», «скрепя сердце» (неграмотное «скрипя сердце» у
ОРФО не вызывает возражений).
В системе проверки правописания ОРФО наличествуют
устаревшие, возвышенно-поэтические лексические единицы
«угль» и «огнь». А в результате - случайный пропуск буквы
«о» в словах «угОль» и «огОнь» спеллером не будет замечен.
Есть также «глад» в значении голод, «хлад» (холод), «млеко»
(молоко), «ворог» (враг) и т.п.
Если в прилагательном «маленький» по «техническим
причинам» пропадет начальная буква «м», то WORD•овский
спеллер на получившееся слово «аленький» никак не
прореагирует. Он не подчеркнет его красной волнистой
чертой, т.к. эта лексема есть в словаре автокорректора
(имеется в виду аленький цветочек). Синтаксис предложения
при замене «маленький» на «аленький» останется без
изменений. Спеллер ОРФО почему-то не подчеркивает это
слово «аленький» также и зеленой волнистой чертой, даже
если настроить его параметры для деловой переписки.
Стоит ли держаться за такие низкочастотные слова, если они
приводят к пропуску ошибок в высокочастотных словах, т.е.
мешают автокорректору выполнять свои функции?
Справедливости ради следует отметить, что некоторые слова
все же вызывают у автокорректора ОРФО сомнения с точки
зрения стиля. Спеллер относит их к жаргонной, разговорной,
экспрессивной али просторечной лексике (но союз «али» пока
что возражений у спеллера не вызывает). Они
подчеркиваются то красным, то зеленым, то - при какой-то
настройке - вообще никак не подчеркиваются, хотя к другим
словам подчеркивания выдаются. Подсказка сообщает иногда
соответствующие предупреждения. Но к архаичной лексике и
узкоспециальным терминам это, как правило, не относится.
В то же время в редакторе WORD•а не вызывают возражений с
точки зрения стиля некоторые грамматические формы
(варианты), которые следовало бы сопровождать в
необходимых случаях соответствующими предупреждениями.
Примеры:
С этою будущею перерегистрациею и с полученною лицензиею
мы начинаем новый этап.
Предприятья, связанные с машиностроеньем, не подлежат
снятью с участья в соревнованьях.
Варианты типа «открытья», «свершенья», «томленье» и т.п.
иногда встречаются в поэтических текстах ради сохранения
определенного размера.
Еще одно пожелание. В следующих версиях автокорректора
низкочастотные словоформы, слишком похожие на достаточно
частотные словоформы, могли бы иметь особые пометы,
благодаря которым могли бы выдаваться соответствующие
предупреждения.
Например, междометие «щелк» весьма похоже на
существительное «шелк», есть «шипы» и «щипы» (заметим,
что «ш» и «щ» на глаз плохо различаются).
Представим себе такую ситуацию. В тексте несколько раз
встретилось слово «страница», но только один-два раза «странница» или «станица». Убрать из словаря последние два
слова? Это не лучший выход, они достаточно употребительны.
Для подобных случаев хорошо бы предусмотреть особое
сообщение: Это ли слово имелось в виду?
А вот еще достаточно типичный пример перегруженности
словаря автокорректора «вредными» для его работы словами.
Система ОРФО вроде бы не имеет ничего против устаревшего
слова «теля» в значении теленок даже при настройке на
деловую переписку. Казалось бы, много места это «теля» не
займет, пусть будет! Но беда в том, что оно не лежит спокойно
в словаре спеллера, а иногда вылезает, как подводный
камень. Слово «теля» предлагается WORD•овской подсказкой
в перечне вариантов для некоторых слов с ошибками.
Например: для ошибочного леля вместо деля, для заметителя
(с пропуском буквы «с») и т.д.
Спеллер WORD'а не замечает ненужных пробелов и дефисов
(разрезания словоформ) в таких примерах:
Учи теля, люби теля, глуши теля, зри теля.
Держа теля, раде теля, числи теля, мечта теля, вои теля.
Нагрева теля, нагрев-теля, строи теля, домострои теля.
Указа теля, указ-теля, показа теля, иска теля, иск-теля, спаса
теля и др.
Еще пример безнаказанного разбиения - «теля тина».
Подобных как бы осмысленных разбиений с «теля»
обнаружено свыше 230. Если бы этот словарь использовался
при машинном переводе, то при таких разрезаниях на выходе
получалось бы: учи теленка, взрыва теленка (вернее,
иностранный эквивалент этих словосочетаний) и т.д.
Кстати, почему-то множественного числа от отглагольных
существительных «разрезание», «обрезание», «подрезание» и
многих других этот спеллер не признает. Система ОРФО
подчеркивает красным словоформы: угадываний (но слово
угадывания как родительный падеж единственного числа не
подчеркивается), самобичеваниям, везениями, о
размораживаниях и т.п.
Ниже даны еще примеры существительных женского и
среднего рода, которым в пику словарю А.А. Зализняка и
другим словарям отказано во множественном числе.
Нет репутаций, резекций, кондиций, сигнализаций,
ориентаций, стимуляций, симуляций, документаций, авиаций,
идентификаций, информаций, вакцинаций, пальпаций,
инкассаций, констатаций, экспроприаций, консерваций,
пролонгаций, дискредитаций.
Не повезло пленениям, низложениям, обрамлениям,
позированиям, чувствованиям, отставаниям, разгибаниям,
учащениям, совмещениям, обольщениям, томлениям,
избраниям.
Зато повезло низложеньям, обрамленьям, обольщеньям. Они
представлены в словаре спеллера.
С другой стороны, к слову «тягота» в словаре А.А. Зализняка
дано указание, что это слово употребляется обычно во
множественном числе: «тяготы». Однако спеллер ОРФО
допускает словоформы «тяготе», «тяготой», «тяготою»,
которые скорее могут получиться в результате опечаток.
При поверхностном тестировании обнаружилось также, что
словоформу «нескольку» из выражений типа «по нескольку
раз», глагольные формы «выбросьте», «чтут» (как вариант
формы «чтят») WORD•овский автокорректор считает
неправильными.
Таковы грамматические особенности системы ОРФО - вопреки
словарю А.А.Зализняка и другим академическим словарям.
Авторы спеллера «узаконили» действительно часто
встречающееся в современных текстах, но не рекомендуемое
словарями слово «найм» - при нормативной форме
именительного падежа «наем». Однако пока что они еще не
рекомендуют нам писать «петербурЖский» вместо
«петербургский», что тоже стало частенько встречаться даже
у дикторов на радио, а также в газетах.
Загадочное слово «ник» пропускается как нормативное. Судя
по тому, что спеллер его не склоняет, это форма прошедшего
времени от глагола «никнуть». В «Грамматическом словаре
русского языка» А.А. Зализняка дается форма «никнул».
Существительных на «-ник» очень много и возможных
разбиений тоже: «чай ник», «разряд ник», «тех ник», «провод
ник», «призыв ник», «десант ник» и т.д.
Разумеется, многие употребительные местоимения и другие
короткие слова тоже нередко совпадают с началами или
концами более длинных словоформ. С этим приходится
мириться. Но старые наименования букв «како» (есть такая
буква!), т.е. название буквы «к», «ерь» (название мягкого
знака) и «ук» (старое название буквы «у») можно было бы
убрать из словарей спеллера, тем более что некоторые
названия букв уже убраны - и никаких больше «еров»! «Ер» старое название твердого знака - отсутствует, хотя в словаре
спеллера и порождается такая словоформа. Как нетрудно
убедиться, словоформы «ер», «ерой» и т.д. образуются в
системе ОРФО от просторечного устаревшего слова «ера». В
«Толковом словаре русского языка» под редакцией
Д.Н.Ушакова (1935г.) дается значение слова «ера» - озорной
гуляка, волокита. Похоже, что от него образованы слова
«ерник» и «ерничать». Еще пример. Слово «зуй», которое не
вызывает никаких возражений спеллера с точки зрения стиля
и никак не подчеркивается, тот же словарь Д.Н.Ушакова
определяет как областное название некоторых птиц из рода
куликов. Слово «беремя» в этом же словаре тоже имеет
помету «обл.» (беремя дров). Так ли необходимы областные и
диалектные слова в основном словаре системы проверки
правописания?
Есть в словаре спеллера ботанический термин «перилла», есть
редкий глагол «неводить», образованный от существительного
«невод». При очень распространенной опечатке - замене
символа «л» на «д» в глаголе «неволить» - слово с такой
ошибкой не будет подчеркнуто (не хочу тебя невоДить). Кроме
того, спеллер ОРФО в результате пропускает ошибочные
сращения глагольных форм от «водить» с отрицанием «не»:
«невожу», «неводит», «неводили» и т.п.
Таких устаревших и редких словоформ очень много
обнаруживается, в частности, при рассмотрении вариантов,
рекомендуемых подсказкой.
Подобные почти не употребляемые слова можно было бы
убрать из словаря автокорректора, поскольку он нацелен на
обнаружение ошибок в текстах массового пользователя и не
обязан включать в себя всю сокровищницу архаичной
лексики. Убранные слова просто будут подчеркиваться
красной волнистой чертой как ненайденные.
В идеале по желанию пользователей им можно было бы
предоставлять дополнительно разные тематические словари.
Но и сейчас уже автокорректор предоставляет возможность
завести свой небольшой личный словарь. Другой вариант выдавать предупреждения не только к жаргонной, но и к
архаичной лексике.
Для тех междометий, которые совпадают с началами или
концами высокочастотных словоформ и могут при разбиениях
остаться незамеченными, осмелюсь предложить временное
неординарное решение. Пока автокорректор не умеет их
обрабатывать особым образом, не будет большой беды, если
переместить некоторые из них в словарь имен собственных.
Тогда спеллер будет их подчеркивать красным только в тех
случаях, когда эти междометия не начинаются с заглавной
буквы. Как правило, многие из них чаще встречаются в начале
фразы. Примеры:
Чу! Ша! Ату его! Ух! Ах! Ау! Агу! Угу! Ого! Ай! Ой!
С другой стороны, сокращения «и проч.», «и др.» хорошо бы
проверять на заглавную букву, чтобы впредь больше не
допускалось: «Проч.», «Др.».
В словаре А.А. Зализняка особым знаком (Х) отмечены
прилагательные, краткие формы от которых почти никогда не
употребляются. Однако в системе ОРФО они образуются
(порождаются):
свеженька, красивеньки, готовеньки, узеньки, беленька,
зелененьки, солененьки, осторожненька, лысенька, чистеньки,
легонька, тихонька и т.д.
А вот еще большая россыпь «подводных камней».
Если в словах «отряд», «подотряд» по «техническим
причинам» пропадет конечная буква «д», то спеллер
воспримет получившиеся слова «отря» и «подотря» как
деепричастия от глаголов «отереть» и «подтереть». Правильно
образованные деепричастия «отерев» и «подтерев», напротив,
подчеркиваются красным как ошибочные. В системе ОРФО
образуется очень много более чем странных деепричастий от
глаголов совершенного вида:
распростря, простря, падя, нападя, выгрызя, заползя,
перемря, помря, отомря, умря, вымря, запря, сопря, отопря,
вотря, сотря, разотря, утря, вытря, а также исчезши, подвигши
и т.д.
С другой стороны, те деепричастия прошедшего времени,
которые даны в «Грамматическом словаре русского языка»
А.А.Зализняка - перемерев, отперев, растерев, вытерев, - в
словарях ОРФО не представлены и подчеркиваются красным.
Кроме того, автокорректором порождаются достаточно странно
звучащие, пусть даже теоретически возможные формы
деепричастий от глаголов несовершенного вида. Примеры:
делав, рвав, быв, ев, пев, грев, зрев, жирев, крыв, мяв, крав,
жав, читав, давав, дышав, лежав, требовав, рисовав, сидев,
висев, видев, смотрев, ревев, вертев, жалев, шумев, шутив,
мирив, мстив, дув, стояв, теряв, гоняв, подгоняв, изготовляв,
заявляв, обновляв, заставляв и т.д.
Иногда при соответствующей настройке подсказки такие
деепричастия подчеркиваются зеленым как не рекомендуемые
данным спеллером. Однако те же самые словоформы как раз
этой же подсказкой рекомендуются в качестве нормативных,
если не найденные в словарях автокорректора слова однойдвумя буквами от этих деепричастий отличаются.
Образование таких малоупотребительных грамматических
форм не только засоряет подсказку, но может приводить и к
пропуску ошибок.
Так стоит ли не рекомендуемыми никакими справочниками
грамматическими формами обременять системы проверки
правописания?
Более привычно, хотя и несколько просторечно звучат такие
же (см. выше) формы деепричастий прошедшего времени от
глаголов несовершенного вида с добавлением «-ши».
В словаре А.А. Зализняка в разделе «Грамматические
сведения» в главе «Деепричастие прошедшего времени»
говорится, что «...деепричастия от глаголов несовершенного
вида в современном языке употребляются очень редко
(обычно они заменяются деепричастиями наст. времени)» и
«почти всегда с отрицанием:
никогда не видевши, ни разу не говоривши, не спавши всю
ночь».
Казалось бы, словарь автокорректора ОРФО очень полный, раз
включает в себя даже редко встречающиеся в современных
текстах слова.
А вот и нет! Не находятся и подчеркиваются красным недавно
появившиеся или ставшие популярными в русском языке, но
не всегда имеющиеся в академических словарях слова:
дедовщина, вкуснятина, мобильник, дизайнерша («дизайнер»
есть, подсказка выдает «дизайнер ша», «дизайн ерша» и
«дизайнера»), мегаполис, реинкарнация, наркодилер,
бойфренд, чернобыльцы, риэлтор, госслужащий,
госструктуры, дефолт, профицит, евро, растаможить,
землеотвод, хот-дог, дорогущий, фермерствовать,
понадкусывать, фоторобот, крышевать, кидалы, педофил,
автослесарь, гиподинамия, зомбировать, электорат,
компромат, обязаловка, лоббировать, пиарщик, оживляж,
телегеничность, хит, отксерить, талиб, антиглобалист,
самопровозглашенный, подбрюшье, провайдер,
интернетовский и многие другие.
Можно не приветствовать засорение родного языка
американизмами или жаргонными словечками, но
желательно хотя бы знать, как они пишутся.
Отсутствие в версиях 1997 и 2000 годов подобных новых слов
можно было бы объяснить нерасторопностью авторов спеллера
или нежеланием вносить «отсебятину». Однако заметим, что
автокорректор в принципе отвечает не на те вопросы, которые
возникают у пользователя. Например, он хочет узнать, как
писать: «пейджер» или, к примеру, «пэйджор», «аудиоплеер»
или «аудиоплейер», а ему как бы говорят, что таких новых
слов в словарях спеллера пока что нет. Но ведь пользователь
потому и сомневается в их написании, что они для него еще не
стали привычными. И даже если он новое слово
«нефтедоллар» наберет, например, с тремя буквами «л»
подряд («нефтедолллары») или в слове «чат» против правил
русской орфографии допустит букву «я» («чят») - реакция
спеллера не изменится - то же подчеркивание красной
волнистой чертой всего слова. И никаких назиданий типа
«Ча», «ща» пиши через «а» в подсказке!
Подсказка автокорректора ОРФО пока оставляет желать
лучшего. Для местоимения «ихний», которое эта система
вполне справедливо объявляет просторечным, но для начала
подчеркивает красным, подсказка не предлагает нормативного
притяжательного местоимения «их», а предлагает термин
«ионий».
Известны и разные курьезы. Поскольку в словаре
автокорректора нет «ельцинизма», в подсказке предлагается
заменить этот сомнительный термин сочетанием «ель
цинизма», в других случаях выдаются также и «стриптиз
ерша», и «мультик анальный». На фамилию Филимонова
подсказка выдает вариант «Фи Лимонова».
Если человек вместо правильной формы родительного падежа
множественного числа «электрополотенец» наберет
«электрополотенцев», то спеллер эту словоформу точно так
же подчеркнет красным и точно также в подсказке не
предложит ничего. Подсказка ОРФО не умеет разбивать
сложные слова не механическими разрезаниями на две
словоформы, а на словообразующие части (в данном случае
следовало отделить «электро-», которое не является
отдельной лексемой) и проверять правильность оставшегося
слова, в нашем примере это ненормативная словоформа
«полотенцев».
Следующие примеры показывают, что создателям
автокорректора не следовало бы ограничиваться в качестве
источников только одним-двумя академическими словарями.
Спеллер ОРФО не знает давно известных слов вроде
«ваххабизма» и «фундаментализма», которые представлены
даже в сравнительно старых изданиях словарей иностранных
слов.
Нет в словарях автокорректора и вполне простых слов, если
не всегда имеющихся в доступных всем изданных в разное
время словарях, то уж наверняка встречающихся в достаточно
авторитетных текстах, и не так уж редко. Примеры:
«заметочка», «телефончик», «проводочек», «наследничек»,
«мамочкин», «папочкин» («мамин» и «папин» есть),
«смог» (есть глагольная форма, нет существительного «смога»),
«переделывание», «подыгрывание» (хотя соответствующие
глаголы имеются), «развыступался», «по-быстрому», «понаучному», «по-абхазски»,
«наисвежайший» (превосходной степени «свежайший»
спеллер тоже не знает), «полупризнание», «лжепатриот»
(таких образований, конечно, немало можно придумать),
«гусарство» и др. Образований от имен собственных,
разумеется, может быть много. Но все же: не находятся в
словаре спеллера ОРФО и подчеркиваются красным слова
«лермонтовский», «тургеневские» (барышни), достаточно
частотное слово «сталинизм» («ленинизм» имеется).
Частые «ложные тревоги», т.е. необоснованные
подчеркивания, приводят к тому, что пользователь перестает
обращать на них внимание и в результате может пропускать
слова с ошибками.
Не все в порядке с отбором имен собственных, удостоенных
чести находиться в соответствующем словаре спеллера ОРФО.
Такие названия, как Алания (Северная Осетия) и Саха
(Якутия), появились в нашем лексиконе примерно в одно и то
же время, но Саха представлена, в то время как Алания,
гордая Ичкерия или новая столица Казахстана Астанав
словаре отсутствуют. С Путиным тоже не все благополучно.
Такой фамилии в словаре имен собственных нет (есть в
основном словаре существительное «путина»). Нет Марианны
(Марьяны), нет и Любови, хотя, например, Мариша, Катька,
Светочка или Шурочка наличествуют.
Нет даже слова Интернет, оно подчеркивается красным
(версия WORD2000).
Для автокорректора ОРФО многие слова с отрицательной
частицей «не-» являются как бы неизвестными. Примеры:
невыездной, нецивилизованность, нетоксичность,
неощутимость, нетипичность, неслучайность, несозвучность,
неочищенность, нехарактерность, несценичность,
непедагогичность, непунктуальность, несинхронность,
незагруженность.
При этом соответствующие лексемы без частицы «не-»
представлены в словаре и пропускаются как правильные.
С другой стороны, сомнительные сращения вроде
«несделано», «неотражен», «неполучен», «непредусмотрены»
и др. спеллером ОРФО часто пропускаются. Заметим еще раз,
что склеивания слов очень часто могут возникать и «по
техническим причинам», при сканировании, при
редактировании и т.п.
Примеры предложений с ошибками на отрицание «не»:
Этот звук мы неслышим. Защита здесь непредусмотрена.
Посылка неполучена. Правильные выводы несделаны.
Опять никаких возражений и указаний на ошибки со стороны
WORD•овского спеллера.
Еще одна загвоздка, с которой приходится сталкиваться:
двусмысленно выражаемая реакция на смешение латинских и
русских букв. Очень часто пользователь не сразу
спохватывается и поздно переключается на русский регистр.
Впоследствии он или другой человек может увидеть в тексте
вроде бы вполне нормальные слова, целиком подчеркнутые
красным, например:
Koмпромисс
Koллегия
Koнстатация
Poccийский
Xaрактеристика и др.
Английский или другой «иностранный» спеллер подчеркивает
красной волнистой чертой свою часть такого смешанного
набора символов, а русский спеллер такой же красной чертой
- свою. Недоумевающий пользователь, если ему не хочется
каждый раз вызывать подсказку, может усомниться в
компетентности автокорректора и перестать обращать
внимание на все эти подчеркивания.
Из вышеизложенного напрашивается вывод - на спеллер
надейся, а словари и грамматику изучай!
Обратная сторона
12.11.2009 Разработанная в США компьютерная программа
для автоматической оценки школьных сочинений на
английском языке, поставила Хемингуэю "тройку с минусом",
назвав его язык стилистически и лексически небрежным.
Дэвид Райт (David Wright, руководитель Chartered Institute of
Educational Assessment, CIEA): По оценке программы, язык
Хемингуэя не соответствует уровню школьного
экзамена. Программа не оценила по достоинству и знаменитую
речь Уинстона Черчилля "The Finest Hour" посчитав, что язык
Черчилля страдает лексическими повторами. Она не
распознала существительное "might" (могущество), приняв его
за неправильно употребленный модальный глагол "might
have" (мог бы, могли бы). Программа не поняла отрывок из
"Повелителя мух" Уильяма Голдинга - по ее выводу, структура
предложений писателя ошибочна. А первый абзац "Заводного
апельсина" Берджесса, компьютер не понял совсем, назвав
текст "невразумительным".
Грэм Херберт (Graham Herbert, зам главы CIEA): Некоторые
американские школьники научились обманывать компьютер и
писать "понятным" для него языком. На данный момент
надежного и точного способа проверить сочинения на
английском языке с помощью компьютерной программы не
существует.
Скачать