#Интересно о науке

Для человека, который хочет изучать язык и его устройство, в интернете доступно невероятное количество данных: самые разные тексты на всех возможных языках. Сейчас мы, например, можем не просто посмотреть, как люди употребляют то или иное новое слово, но и проследить, когда оно появилось в языке и как со временем меняется его значение. Для этого есть много инструментов, и они всё время совершенствуются.

Ведь как было раньше? Выходили, допустим, словари новых слов. Откуда их авторы черпали информацию? В основном из собственных наблюдений: лингвист встречал где-то неизвестное слово, записывал его и постепенно накапливал материал. Но проверить, насколько это слово распространено, было очень трудно. Если сейчас вы заглянете в словарь актуальной лексики начала XXI века, вышедший в 2006 году, то обнаружите там, к примеру, слово «веб-таксофон». Но сейчас этого слова в языке нет, да и тогда, скорее всего, по сути дела не было — поисковые системы почти не находят примеров. Мелькнуло и исчезло. «Спам» и «снек» остались, а «веб-таксофон» нет. Зачастую, пока словарь готовят к изданию, редактируют — пока вся эта работа идёт, слово успевает выйти из активного употребления или изменить значение.

 

Теперь даже для самых новых слов можно быстро получить статистику употребления в интернете.

Есть и методы автоматического выявления новых слов — скажем, в Твиттере. Но пока далеко не всё можно решить без человека. Писали мы как-то статью о сокращённых названиях бытовых предметов. Например, «велосипед» сейчас сокращают не только до знакомого многим «велик», но и до «вел». А если мы начнём изучать это слово в интернете, то столкнёмся с проблемой, а именно с глаголом «вёл» — только без точек. По контексту различить можно, но для этого нужно сесть и разбираться.

Говоря о языке и информационных технологиях, сложно уклониться от вопроса, ухудшает ли интернет грамотность. Однозначного ответа нет. С одной стороны, большинству пользователей интернет заменил орфографический словарь, а это не всегда надёжно. Мой любимый пример — слово «борсетка». Да, именно так, через «о», это слово написано в орфографическом словаре, но написаний через «а» в интернете на порядок больше. Лингвист может обнаружить этот факт и сделать выводы, почему так получилось, чем оправдано одно и другое написание. А неспециалист просто использует вариант, который предлагают поисковые системы, не задумываясь — и тем самым нарушит норму. Для лексикографа интернет как огромное хранилище самых разных текстов — это замечательно, но для нелингвистов интернет как источник сведений об утверждённой норме — скорее плохо.

А хорошо ли, что компьютер и телефон исправляют за нас ошибки? Практика интернет-письма отличается от бумажной. Что написано пером, не вырубишь топором, а в Сети написанное обычно можно исправить. Это приводит к тому, что люди меньше следят за грамотностью: скорость важнее. Да и зачем напрягаться? Гаджеты нас поправят. Когда школьники, да и взрослые, переписываются, а смартфон исправляет их ошибки, это, в принципе, неплохо — лучше, чем создавать неграмотные тексты, которых в интернете и так хватает. Но телефон может сделать такую замену, что потом краснеть придётся: неудачным автоисправлениям посвящены целые разделы юмористических сайтов.

Неудачным автоисправлениям посвящены целые разделы юмористических сайтов.

Впрочем, курьёзами дело не исчерпывается. Ошибки в таких текстах всё равно есть, просто они другие — их сложно исправить автоматически. Например, если я напишу «какова черта» вместо «какого чёрта», машина не исправит написанное, потому что оба этих слова существуют, а определить смысл высказывания гораздо сложнее, чем проверить его написание. Системы проверки орфографии постоянно совершенствуются, но главный принцип сохраняется: необычные написания исправляются на более частотные. А это не всегда уместно.

Например, я часто использую в переписке аббревиатуру ЗК — задачная комиссия олимпиады по лингвистике. А программа Punto постоянно переключает раскладку и исправляет ЗК на PR. Понятно, что для большинства людей PR важнее, чем ЗК (кстати, и аббревиатура-то эта, ЗК, обычно означает вовсе не задачную комиссию). Но лично я про PR вообще не пишу, а про ЗК — часто. Это то, что в компьютерной лингвистике называется «длинный хвост». Статистика может много чего решить, может быть, 90% задач, но дальше остаётся длинный хвост из огромного количества очень редких случаев. У кого-то ЗК, у кого-то домашнее имя, кто-то из принципа в шутку всегда пишет не АнЕчка, а АнИчка. Это как если бы мы писали в школе записки одноклассникам, а кто-то сидел рядом и исправлял: думаю, нам бы показалось это неуместным.

А в интернете вообще те же нормы, что в офлайне? Не совсем.

Лингвисты изучают интернет в том числе как среду коммуникации, и действительно — люди здесь пишут не так, как в других местах. Этой теме посвящён ряд исследований. В интернете пишут быстрее, меньше следят за аккуратностью и грамотностью; иногда и просто новые нормы рождаются. Например, в школе нас учат ставить точку после предложения; в интернете после реплик в диалоге точки можно увидеть всё реже. А если они вдруг появляются, это может восприниматься как проявление агрессии.

Аналогично с большими буквами: мы гораздо реже используем их в Сети (или в сети?). Некоторые люди и вовсе пишут только с маленькой, даже имена и в начале предложения — не потому, что они безграмотные, а вполне осознанно. Хочу и пишу всё маленькими буквами, это создаёт одно впечатление, хочу — всё большими, совсем другое.

С кавычками история тоже меняется. Например, вот мы играем в «Шляпу» или в шляпу? Вроде бы это название игры и кавычки нужны. Но вот футбол — тоже игра, название которой, как и в «Шляпе», происходит от предмета, который для этой игры нужен: football, футбольный мяч. Футбол всегда пишут с маленькой буквы, а игру в шляпу — не всегда, но в интернете чаще. Играть в «Дочки-матери» или в дочки-матери? В «Магазин» или в магазин? На интернет-форумах кавычек и больших букв здесь не будет, а в бумажных журналах редакторы могут и поставить. Даже дети, которые ведут активную онлайн-переписку, ощущают, что здесь другие правила. Они могут специально писать «харашо» вместо «хорошо» — не потому, что не знают, как правильно, и не потому, что так быстрее. Тут такие правила — это чат, а не контрольная.

Ну, скажет кто-то, выходит, что интернет — рай для лингвиста, но ад для учителяНа самом деле всё несколько сложнее. Интернет — это разнообразие и огромные возможности для самовыражения, что, конечно, здорово. Но многие, прежде всего дети — те, кто ещё не усвоил нормы, — склонны воспринимать вариации как эталон. Раньше считалось, что человек, который много читает, имеет все шансы быть грамотным. Теперь же дети читают далеко не только учебники и хорошо отредактированные книги, и обилие неграмотных текстов действительно может плохо сказаться на умении писать без орфографических ошибок. Но, с другой стороны, школьное сочинение с ошибками прочтёт только учитель, а пост в интернете увидят и, возможно, прокомментируют — укажут на ошибки — разные люди, так что появляется новый стимул писать грамотно. Что окажется важнее, ещё предстоит выяснить, и это очень интересно!

Борис Иомдин
Кандидат филологических наук, доцент Школы лингвистики НИУ ВШЭ, преподаватель Школы анализа данных «Яндекса», заведующий сектором теоретической семантики и ведущий научный сотрудник Института русского языка им. В. В. Виноградова РАН.
Иллюстрации

Маргарита Ворон