For faster navigation, this Iframe is preloading the Wikiwand page for Обсуждение Википедии:AutoWikiBrowser/Typos.

Обсуждение Википедии:AutoWikiBrowser/Typos

Материал из Википедии — свободной энциклопедии

Пожалуйста, добавляйте новые темы снизу

Формы слова

[править код]

Хотелось бы узнать мнение, в каком виде лучше давать формы слова?

Можно явно указывать все суффиксы и окончания для максимальной точности, сооружая примерно такие выражения: \b(А|а)банент(а(?:ми?|х)?|у|о[вм]|е|ы)?\b — причём только для существительных. Если добавить поиск и прилагательных во всех формах (абонентный, абонентский) то получается вообще ужасно.

Или же можно писать просто \b(А|а)банент(\w*?)\b, но тогда будут находиться и «исправляться» в том числе и явно ошибочные варианты типа «абанентовпредупреждают». Причём это будет внесено в описание правки.

Я обратил внимание, что в английском и французском списках всегда явно указывают все словоформы и не используют подобные подстановки. Solon 15:26, 1 декабря 2006 (UTC)[ответить]

Англичанам и французам проще - у них морфология поскромнее. Можно вместо * (zero or more times) использовать например {0,5} (0 to 5 times). BTW, *? не имеет смысла, т.к. ? = 0 or 1 time. Если я конечно ничего не путаю ;-) --Volkov (?!) 15:44, 1 декабря 2006 (UTC)[ответить]
На самом деле, имеет. "*" и "+" - так называемые "жадные" (greedy), то есть повторение происходит наибольшее возможное число раз. Например из строки "профффесор кислых щей" по шаблону: \b(П|п)ро(ф+)е(с+)ор(.*)\b будет найдено целиком "профффесор кислых щей", а не просто "профффесор", так как под "(.*)\b" будет расценена последовательность: " кислых щей". Если вместо ".*" написать ".*?", то "*" станет "ленивым" (lazy), и повторение будет произведено минимальное количество раз, то есть до первого "\b", и результат будет "профффесор". А вообще есть рекомендация "use the dot sparingly", и вместо точки лучше использовать что-то более конкретное. Но это не совсем по теме. :) Solon 16:56, 1 декабря 2006 (UTC)[ответить]

Разное

[править код]

Убрал некоторые неработающие и уе присутствующие в программе автозамены. Но думаю, что вообще не стоит включать сюда замены, не связанные с орфографией, чтобы не создавать путаницы. Вообще конечно было бы удобно иметь возможность произвольно подключать к AWB любые подобные списки автозамены, которые можно было совместно редактировать в вики. Но это уже скорее вопрос к разработчикам. Solon 11:20, 12 апреля 2008 (UTC)[ответить]

еще → ещё ?

[править код]

Предлагаю убрать эту замену. Есть мнение [1], что «еще» (безударная частица) и «ещё» (наречие) — воообще разные слова. Shureg 13:25, 13 июня 2008 (UTC)[ответить]

Слова-то может и разные, но писать одно из них через Е — это бред сивой кобылы. Или вы произносите в каких-то случаях ещё через Е (е́ще / еще́) ??? — Dirl 20:54, 13 июня 2008 (UTC)[ответить]
По крайней мере, в в словаре Ушакова пишется именно так. А произносятся они действительно по-разному. Как минимум можно говорить о неустоявшейся норме. А значит, (полу)автоматически заменять где попало еще на ещё не стоит.
Вот что говорит на этот счёт грамота.ру. — Dirl 15:41, 14 июня 2008 (UTC)[ответить]

у меня AWB испортил стилевые слова "background"... infovarius 22:43, 25 августа 2008 (UTC)[ответить]

Мне он тоже предлагает заменить "background" на "bacкгround". Где это можно исправить? — ОВ3Я2ДСН23 18:36, 9 октября 2008 (UTC)[ответить]

Бангладеш

[править код]

По правилам русского языка[2] слово Бангладеш не слоняется, поэтому нужна замена Бангладеш(а,у,е,ь) на Бангладеш --Tat1642 21:49, 25 января 2009 (UTC)[ответить]

1960-ые → 1960-е

[править код]

<Typo word="1960-ые и подобное" find="\d-ы(е|м|х)" replace="$1-$2" /> Так правильно будет? — Obersachse 18:12, 3 февраля 2009 (UTC)[ответить]

Успокойте меня, пожалуйста - скажите, что вот это дополнение не означает смертного приговора термину репер. Андрей Романенко 15:55, 9 марта 2009 (UTC)[ответить]

Спасибо. Честно говоря, впервые узнал о существовании этого списка. Изучаю его в задумчивости. Пытаюсь понять, например, как существование строчки

<Typo word="бренд" find="\b(Б|б)рэнд(\w*)\b" replace="$1ренд$2" />

согласуется с существованием статьи Макс Брэнд. Андрей Романенко 16:02, 9 марта 2009 (UTC)[ответить]
Именно поэтому исправление орфографии Автовикибраузером в автоматическом режиме отключено. Я считаю, что в подавляющем большинстве случаев замена оправдана, а в тех единичных случаях, где нет ответственность лежит на пользователе бота или AWB. — Obersachse 16:08, 9 марта 2009 (UTC)[ответить]
То есть эту штуку запускают вручную, в управляемом режиме? Тогд ОК — кажется, все возможные сомнительные случаи в этом списке человек может отследить. Разве что на всякий случай хочу сообщить всем пользующимся, что если когда-нибудь им встретится словосочетание «зеленое вино» (например, в песне из оперы Римского-Корсакова «Садко»: «Обносите зеленым вином, Зеленым вином заморским!»), то в этом древнерусском обороте нет буквы «ё», потому что ударение падает на окончание: «зелено́ вино», «зелены́м вином» (и имеется в виду отнюдь не цвет). Андрей Романенко 16:26, 9 марта 2009 (UTC)[ответить]

АгенТсТво

[править код]

То, что ищется слово целиком приводит к тому, что часто не срабатывает тупо-фикс. ·Carn !? 11:26, 17 апреля 2009 (UTC)[ответить]

Как это сделано?

[править код]

Почему в статье Ли Тхай То фраза "Ле Нгоа Чиеу" викификатором не изменяется на "Ле Нога Чиеу", хотя соответсвующая замена для ноги прописана на странице. Как это сделано? — Дмитрий Никитин 13:52, 11 июня 2009 (UTC)[ответить]

Замечательно. Тогда давайте исключим эту Ногу, раз нельзя запретить эту автозамену для определенноой статьи. — Дмитрий Никитин 15:11, 11 июня 2009 (UTC)[ответить]
False positives есть всегда, не только на этой ошибке. Тот же бренд/брэнд. Просто надо ботов лишний раз не гонять по ним. —LimeHat 16:25, 11 июня 2009 (UTC)[ответить]
Никто специально и не гоняет. Просто будешь проставлять\удалять\изменять категории или проставлять шаблоны и в фоновом режиме сделаешь такую групую замену. Причем не понятно ее происхождение. Факт опечатки единичен, зачем ее занесли в общий список частых опечаток\орфографических ошибок. — Дмитрий Никитин 17:15, 11 июня 2009 (UTC)[ответить]
Я же говорю — такие случаи встречаются на разных заменах. И на ёфикации (например, статьи Ё (кириллица)); и на бренд/брэнд (примеры сейчас не вспомню, но буквально сегодня несколько раз сталкивался, исправляя эту ошибку) и прочее прочее. Поэтому, проблема более "глобальна", чем с ногой. Поэтому и говорю — а стоит ли лишний раз (при той же массовой категоризации) исправлять их ботами? —LimeHat 17:39, 11 июня 2009 (UTC)[ответить]

автозамены

[править код]

Если нет возражений и ошибок, то предлагаю добавить следующие автозамены

<Typo word="военачальник" find="\b(В|в)оен+оначальник(\w*)\b" replace="\1оеначальник\2" />
<Typo word="комментарий" find="\b(К|к)оментари(\w+)\b" replace="\1омментари\2" />
<Typo word="команда, командир" find="\b(К|к)омманд(\w*)\b" replace="\1оманд\2" />
<Typo word="приемлемый" find="\b(П|п)р[еи]емлим(\w*)\b" replace="\1риемлем\2" />
Опс, надо исключить как то "действия отрядов коммандос" — Дмитрий Никитин 14:14, 11 июня 2009 (UTC)[ответить]
(К|к)омманд(?!ос|о\b)(\w*) -- так? Коммандир комманды коммандосов коммандовал коммандо.
добавил — Дмитрий Никитин 15:01, 16 июня 2009 (UTC)[ответить]

Орфография

[править код]

Хочу попросить отправить бота исправить «агенств_» на «агентств_», «приемлим_» на «приемлем_», «военоначальник», «военноначальник» на военачальник, коммандир на командир, комманд_ на команд_, коментари_ на комментари_. Ещё нужно исправить ошибки по этому списку, иначе для чего он существует в Википедии?! Кроме кеш/кэш, там сейчас война. Большое спасибо! Четыре тильды 08:55, 11 июня 2009 (UTC)[ответить]

Лучше внести в RegexTypoFix, потом попутно править rubin16 10:59, 11 июня 2009 (UTC)[ответить]
Внесите, пожалуйста, я в этом совсем ничего не понимаю. Четыре тильды 12:23, 11 июня 2009 (UTC)[ответить]
если нет возражений, то добавлю в общий список — Дмитрий Никитин 14:08, 11 июня 2009 (UTC)[ответить]
не вызовет ли это споры, так же как кэш\кеш и бренд\брэнд — Дмитрий Никитин 19:02, 11 июня 2009 (UTC)[ответить]
  • Всё, что может вызвать споры, обязательно их вызовет. К примеру, на странице обсуждения Ё (кириллица) вы можете найти сентенции, что нужно вернуться к "стандартному языку" без написания "ё". А в данном случае Четыре тильды приводит авторитетный источник: Русский орфографический словарь: около 180 000 слов / Российская академия наук. Институт русского языка им. В. В. Виноградова / О. Е. Иванова, В. В. Лопатин (отв. ред.), И. В. Нечаева, Л. К. Чельцова. — М., 2005. — 960 с. — ISBN 5-88744-052-X. -- AVBtalk 19:47, 11 июня 2009 (UTC)[ответить]

Ещё предложение, исправлять написание единиц измерений (далее регэксп-псевдокод):

  • ([0-9]+)\s*Герц → \1 герц
  • ([0-9]+)\s*гц → \1 Гц
  • ([0-9]+)\s*[кК]гц → \1 кГц
  • ([0-9]+)\s*[мМ]гц → \1 МГц

Здесь имеется ввиду, что "герц" после числа должен идти с пробелом и со строчной буквы, сокращение пишется с прописной ("Гц"), "кило" со строчной ("кГц"), а "мега" - с прописной ("МГц"). Причём в исходном контексте суффикс может идти без пробелов после числа, с одним или несколькими пробелами (\s*), а пробелы могут быть простыми или неразрывными (а если будет обрабатываться тег &nbsp;, будет тоже хорошо). Соответственно, при замене после числа должен добавляться неразрывный пробел (дай бог памяти, это \uA000). Ещё было бы здорово, если бы игнорировались ссылки в суффиксах (пример). -- AVBtalk 20:27, 13 июня 2009 (UTC)[ответить]

Орфография

[править код]
Теоретически может быть и «по окончанию», например, «по окончанию слова можно определить падеж», возможно, что-то подобное может встретиться в статьях по лингвистике. --Дарёна 17:21, 14 июня 2009 (UTC)[ответить]
Мне кажется, этот сравнительно небольшой урон статьям по лингвистике быстро ликвидируют наблюдающие за ними лингвисты. Четыре тильды 17:44, 14 июня 2009 (UTC)[ответить]
Согласна. Если это будет сделано разово, то нет проблем. --Дарёна 18:37, 14 июня 2009 (UTC)[ответить]
Спасибо за поддержку. :) Четыре тильды 18:39, 14 июня 2009 (UTC)[ответить]
\b(П|п)роцес(?!с)(\w*)\b → \1роцесс\2 ?? — Дмитрий Никитин 14:52, 16 июня 2009 (UTC)[ответить]

Вавилон 5 →→ «Вавилон-5»

[править код]

Я являюсь автором/слежу за многими статьями по вселенной «Вавилона-5». Проблема в том, что многие правки изобилуют неграмотными фразами и т.д. Все это решаемо. Однако, прописать подобное исправление мог бы и бот. Одна закавыка - нет ли пересечений со статьями по известной древней цивилизацией?
Прошу переписать в текстах статей все совпадения подобного рода, особенно тех статей, которые прописаны в категории Вавилон-5. — Эта реплика добавлена участником Zac Allan (ов) 20:03, 30 июня 2009 (UTC)[ответить]

По-прежнему нет желающих? Жаль. А то ляпы в тексте лежут глаз. Можно было бы в какой-нибудь «литературно-исправляющий» бот добавить функцию... - Allow 21:16, 1 июля 2009 (UTC)[ответить]
Если знаете регулярные выражения, то можете добавить правило к списку: Википедия:AutoWikiBrowser/Typos --Ashik talk 04:17, 2 июля 2009 (UTC)[ответить]
А на примере моего случая должно быть так?

<Typo word="«Вавилон-5»" find="Вавилон 5" replace="«Вавилон-5»" /> ? Или как правильнее, научите плиз. - Zac Allan Слова / Дела 12:00, 6 июля 2009 (UTC)[ответить]

Так мы получим замену в "Вавилон 567 до н.э." --> "Вавилон-567 до н.э." — Дмитрий Никитин 12:30, 6 июля 2009 (UTC)[ответить]

Маленькая орфографическая правка

[править код]

«Рейх» --> «рейх» (-а, -у, -ом, и т. д.) — Zac Allan Слова / Дела 18:15, 12 июля 2009 (UTC)[ответить]

Только осторожно! Есть такая фамилия, а она, естественно, пишется с прописной буквой. — Obersachse 18:21, 12 июля 2009 (UTC)[ответить]
Это через Typo у AWB лучше делать rubin16 18:28, 12 июля 2009 (UTC)[ответить]
Я не знаю. как с ним работать. Можешь сделать сам? - Zac Allan Слова / Дела 22:16, 12 июля 2009 (UTC)[ответить]

Наряду

[править код]

А почему у нас такое странное правило?

<Typo word="наряду (с)" find="\b(Н|н)а ряду\b(?= с )" replace="$1а ряду" />

Кто-нибудь может пояснить? — GranD 11:42, 26 августа 2009 (UTC)[ответить]

Думаю, что это опечатка, где-то там пробела не должно быть. Вот правка 2007 года, спросите участника Solon. — AlexSm 14:17, 26 августа 2009 (UTC)[ответить]

в/на Украине

[править код]

Предлагаю добавить замену с "в Украине" на "на Украине". Есть кто против? Advisor 20:40, 22 сентября 2009 (UTC)[ответить]

А как быть с цитатами и названиями статей или книг? Dinamik 20:55, 22 сентября 2009 (UTC)[ответить]
Не учёл. Тогда не получится, а жаль, надоедает откатывать переправляльщиков. Advisor 22:17, 22 сентября 2009 (UTC)[ответить]

нужно исправить

[править код]

представляет из себя → представляет собой — Dirl 11:02, 8 декабря 2009 (UTC)[ответить]

✔ Сделано. --Volkov (?!) 12:27, 8 декабря 2009 (UTC)[ответить]

Не то, чтобы это было ошибкой, но замена «[[Изображение:» или «[[Image:» на «[[Файл:» следовала бы принципам викификатора. --Obersachse 12:45, 8 декабря 2009 (UTC)[ответить]

Можно ведь просто в AWB поставить галочку, чтобы выполнялись general fixes --Volkov (?!) 12:47, 8 декабря 2009 (UTC)[ответить]
Возможно ты прав. Я, кажется, снял эту галочку после того, что где-то прозвучала критика этих general fixes. --Obersachse 13:28, 8 декабря 2009 (UTC)[ответить]

Республика ххх

[править код]

Есть ли возражения против добавления <Typo word="аксиома" find="\bРеспублик(и|е) (Албан|Болгар|Македон|Серб|Словен|Хорват|Черногор)ия\b" replace="Республик$1 $2ии" /> и аналога для винительного и творительного падежа? Вопрос подняли на Википедия:Запросы к ботоводам#Ещё раз про республики (кардинальное предложение). --Obersachse 13:49, 14 июля 2010 (UTC)[ответить]

word="аксиома"? Ashik talk 14:21, 14 июля 2010 (UTC)[ответить]
Эх, проклятый копи-паст. Наверное word="Республика ххх" будет понятным описанием. --Obersachse 05:34, 15 июля 2010 (UTC)[ответить]

словесные суффиксы у чисел

[править код]

Предлагаю заменять последовательность цифр, после которой идёт неверный суффикс, на цифры с верным суфиксом. Ориентировочный регеэксп для правила "Однобуквенное наращение используется, если последней букве числительного предшествует гласный звук или мягкий знак":

  • (\d-)[аеёиоуыэюя](\a\b)$1$2

Здесь из конструкции вида (цифра)(дефис)(гласная буква)(ещё одна буква) убирается гласная буква после дефиса (списки гласных и согласных букв см. в согласные). Пример: "5-ый" → "5-й". Под "\a" и "\b" я обозначил "любая кириллическая буква" и "не буква" соответственно.

В варианте (цифра)(дефис)(три буквы) нужно убирать одну (первую) букву, если вторая буква согласная (иначе: не-гласная) в соответствии с правилом "Двухбуквенные наращения используют, если последней букве числительного предшествует согласный звук", либо убирать две (первую и вторую) буквы, если вторая - гласная (см. выше правило про однобуквенный суффикс). Примеры: "10-ого" → "10-го", "16-тый" → "16-й". -- AVBtalk 03:03, 27 июля 2010 (UTC)[ответить]

словесные суффиксы у годов

[править код]

Наконец, нужно доработать обработку годов. Во-первых, я встречал конструкции вида

  • [[1960]]-е и [[1960]]-х

В этом случае суффикс ("-е" и "-х") нужно вносить в ссылку:

  • [[1960-е]] и [[1960-е|1960-х]]

соответственно. Разумеется, суффикс должен пройти обработку, упомянутую выше:

  • [[1960]]-ые[[1960-е]]

Во-вторых, если после числа (простого или в текстовой части ссылки) идёт суффикс (кроме "-е" и "-х") и буквы "год" (через простой или неразрывный (!) пробел), то суффикс надо убирать (см. правило "Кроме того, не наращивают окончания для номера года и числа месяца, если слово «год» и названия месяца следуют тотчас за числом... Неправильно: в 1991-м году; 5-го марта 1953-го года"). То есть должны обрабатываться случаи

  • 1991-м году1991 году
  • [[1991]]-го года[[1991 год]]а
  • [[1991 год|1991]]-ого года[[1991 год]]а

-- AVBtalk 03:03, 27 июля 2010 (UTC)[ответить]

Проблемные замены

[править код]
  1. В статье Бунин, Юлий Алексеевич предлагается замена: переговоры с петербургскими народниками -> переговоры санкт-петербургскими народниками. Нужно как то подправить.
  2. Замена
<Typo word="белорусский" find="\b(Б|б)еларусс?к(\w*)\b" replace="$1елорусск$2" />

глючит на каждом полустанке. К примеру, в статьях Годлевский, Винцент, Федута, Александр Иосифович, Олехнович, Франтишек используются названия на белорусском языке и в итоге предлагаются варианты:

Беларуская  - Белорусская 
Беларускі    -  Белорусскі

Целесообразен ли такой шаблон, со многими неизвестными? Артём Л. 12:06, 5 августа 2010 (UTC)[ответить]

В большинстве случаев замена пока оправдана. Нужно смотреть, что чаще - ошибка или исключение из правила. --Obersachse 13:16, 9 августа 2010 (UTC)[ответить]
Раз пять точно встретилось Артём Л. 13:23, 9 августа 2010 (UTC)[ответить]
Именно поэтому нужно тщательно проверять дифф перед тем, как записывать правку, и, при необходимости, исправлять вручную. Rainbow 14:00, 9 августа 2010 (UTC)[ответить]

Просмотрел случаи употребления: половина — в цитатах из источников с дореволюционной орфографией, половина — какие-то месопотамские имена собственные. Думаю, можно безболезненно удалить замену «итти — идти», так как потенциальный вред от ее существования превышает возможную пользу. --Bandar Lego 22:12, 3 сентября 2010 (UTC)[ответить]

бол->bol, л->l

[править код]

Что-то не могу найти, почему у меня AWB заменяет эти буквосочетания в ключах сортировки шаблонов... infovarius 14:56, 2 октября 2010 (UTC)[ответить]

Санкт-Петербург

[править код]

Лишнего меняет во фразе Вместе с петербургскими оркестрами она... К сожалению в регэкспах не силен, поправить не смогу. --IGW 09:17, 24 января 2011 (UTC)[ответить]

римейк -> ремейк

[править код]

Предлагаю добавить замену "римейк" на "ремейк". Основание: [3]. Ошибка встречается довольно часто, сейчас около 700 статей содержат ошибку [4]. -- NZeemin 00:49, 31 марта 2011 (UTC)[ответить]

Написание «каратэ» присутствует в официальных наименованиях нескольких организаций и в названии огромного числа книг и статей на русском языке. Считаю, что автоматическая замена «каратэ → карате» безусловна вредна, так как приведёт к искажению наименований организаций и выходных данных источников. Предлагаю эту строчку удалить. INSAR о-в 13:49, 3 августа 2011 (UTC)[ответить]

раз так -- удаляйте. Я полагаю, что консенсуса тут можно ждать годами, поэтому вообразим, что процедура по изменению носит уведомительный характер, а не согласовательный, т.е. изменил, оповестил на странице обсуждения и дело в шляпе. — Dnikitin 14:07, 3 августа 2011 (UTC)[ответить]

(Санкт-)Петербург

[править код]

Я временно удалил замену, связанную с этим словом, по причине большого числа ложных срабатываний ("параллельно с Петербургской" на "параллельно санкт-Петербургской", "200 л. с. петербургского завода" на "200 л. санкт-петербургского завода", информация от INSAR). Поскольку код довольно сложный, прошу тех, кто лучше разбирается в регэкспах, сузить его область действия.

Либо вообще его отменить, т.к. название "Петерберг" без префикса тоже активно употребляется (см. статью История Санкт-Петербурга), и буква "с" перед ним тогда не является сокращением от "Санкт". Смотрите также темы выше - #Санкт-Петербург и #Проблемные замены MaxBioHazard 16:12, 10 августа 2011 (UTC)[ответить]

((Шаблон: → ((

Перенесено на страницу Обсуждение Википедии:Викификатор.

по-умолчанию, поумолчанию → по умолчанию

[править код]

Предлагаю добавить. -- NZeemin 06:00, 27 октября 2011 (UTC)[ответить]

Да, ошибка встречается в ру-вики не менее 90 раз. Добавил. --Movses 07:43, 27 октября 2011 (UTC)[ответить]

Ограничения на начало слова

[править код]

Я не понимаю, почему все маски неправильного написания начинаются с ограничителя \b, говорящего о том, что слово должно начинаться на этом месте. Вполне можно себе представить сложносоставные слова, отличающиеся от приведённых какой-либо приставкой или вторым корнем, такие при текущей схеме будут пропущены. Соответственно, предлагаю из начала масок \b поубирать. MaxBioHazard 04:15, 20 января 2012 (UTC)[ответить]

ареал обитания → ареал

[править код]

Ы? Λονγβοωμαν 17:24, 25 февраля 2012 (UTC)[ответить]

  • В списке нет ни слова "ареал", ни слова, похожего на "обитание" и мой АВБ в режиме исправления ошибок подобных замен не делает (проверил на этой СО). Где такое было ? MaxBioHazard 17:32, 25 февраля 2012 (UTC)[ответить]

Есть ещё ареал распространения (992 включения в Википедии, по Яндексу). --С уважением, Borealis55 13:46, 26 марта 2012 (UTC)[ответить]

деревянистый

[править код]

Неверное исправление: деревянистый → деревяннистый. Нужно подправить.--Cinemantique 21:21, 27 марта 2012 (UTC)[ответить]

Так подойдёт ? --Movses 07:13, 28 марта 2012 (UTC)[ответить]
Нет. Попробуйте обработать викификатором слово деревянистый или фамилию Деревянко — появляется второе «н». --Bff 11:43, 29 марта 2012 (UTC)[ответить]
Так это не викификатор, у викификатора свои замены, о его проблемах пишите на его СО. MaxBioHazard 11:48, 29 марта 2012 (UTC)[ответить]
Извиняюсь. --Bff 11:54, 29 марта 2012 (UTC)[ответить]

Добавьте «ребенок → ребёнок». INSAR о-в 01:43, 6 апреля 2012 (UTC)[ответить]

Белорусский язык

[править код]

Подскажите, пожалуйста, как-то можно отключить автозамену отдельных слов белорусского языка? Например, «раён» → «район». Пробел в начале строки не получается, так как слово находится в списке литературы. — StanTRC 09:24, 27 июня 2012 (UTC)[ответить]

в городе Москве

[править код]

В названии закона: «О внесении изменений в Закон города Москвы от 15 октября 2003 года № 59 „О наименованиях и границах внутригородских муниципальных образований в городе Москве“» AutoWikiBrowser убирает слово городе. Permjak 18:10, 1 июля 2012 (UTC)[ответить]

Hi,

If you're interested, WPCleaner can now be configured to use the same list as AWB to detect spelling and typography mistakes and provide suggestions. --NicoV 09:44, 23 сентября 2012 (UTC)[ответить]

Какой-то код, используемый викификатором, заменяет "чем" на "чём", что не всегда корректно (пример: "нам не о чем сожалеть" → "нам не о чём сожалеть"). -- AVBtalk 01:28, 22 ноября 2012 (UTC)[ответить]

Замена "в месте с" на "вместе с"

[править код]

Думаю, что данную автозамену надо убирать. Сегодня один участник пожаловался на то, что у него эта замена сработала некорректно. Там фраза «рухнул в месте с координатами ...» была заменена на «рухнул вместе с координатами ...». Причём это уже было неоднократно. Так что я строчку <Typo word="вместе (с)" find="\b(В|в) месте\b(?= с )" replace="$1месте" /> пока убираю.-- Vladimir Solovjev обс 11:57, 2 декабря 2012 (UTC)[ответить]

Сочетание «ответств»

[править код]

… в словах «соответствовать», «ответственный» и т. д. Исключений вспомнить не смог. --88.81.32.220 09:04, 23 февраля 2013 (UTC)[ответить]

Я что-то не пойму, это проблемы с текущей какой-то автозаменой или предложение новой автозамены ? --Movses 09:09, 23 февраля 2013 (UTC)[ответить]
Предложение. 88.81.32.220 09:20, 23 февраля 2013 (UTC)[ответить]
Несколько сложно читать мысли...
<Typo word="Ответственно" find="(О|о)твеств" replace="$1тветств" />
Вы эту строчку имеете в виду ? --Movses 12:26, 23 февраля 2013 (UTC)[ответить]
Она самая. Кстати, здесь упомянули одну очень распространённую ошибку «справочнник» — более 1000 (на тот момент) случаев. Можно внести? 89.189.29.215 19:03, 24 февраля 2013 (UTC)[ответить]
Ну, раз она самая, то я добавил и из кивипедии вычистил. Спасибо, что обратили внимание! А «справочнник» MaxBioHazard уже внёс. --Movses 20:00, 24 февраля 2013 (UTC)[ответить]

«Лучший»

[править код]

Приветствую всех!

Требуется сделать автозамену для неправильных форм слов «лучше», «лучший» и других однокоренных. Для слова «лучше» встречаются такие неправильные варианты: «лутше», «лучще», «лушче», «лучьше», «лудше» (даже такое встречается). Насколько я вижу в последних правках, правильное регулярное выражение подобрать не удаётся. --newMitЁk 06:28, 7 марта 2013 (UTC)[ответить]

Проблема тут скорее в том, что есть слова исключения, которые подходят под регулярное выражение. Например:
Я пытался сделать универсальную регулярку, но, видимо, если достигать цели, чтобы замены работали максимально аккуратно, то нужно сделать набор из нескольких регулярных выражений, чтобы отсекать вышеуказанные false positive. --Movses 08:39, 7 марта 2013 (UTC)[ответить]
  • Думаю, цитату надо в nowiki заключать - мало ли какая ещё цитата с "неправильным" написанием будет, не на современном русском языке. С цитатами это вопрос сложный, интересно, где-нибудь есть рекомендация заключать цитаты в nowiki?--newMitЁk 09:35, 7 марта 2013 (UTC)[ответить]
Если желаете, то можете дополнить Википедия:Цитирование ... Практически вы всё равно не заставите людей оформлять по правильному, поэтому при использовании регулярок надо учитывать, что может быть всё что угодно... --Movses 10:00, 7 марта 2013 (UTC)[ответить]
Например, эта статья будет «исправлена», и никакими выражениями этого не изменить, если не использовать nowiki — статья намеренно так написана. А вообще, пользователь AWB должен следить за правками и проверять, не испортилось ли что-нибудь после редактирования. Тут уже ответственность как и автора статьи, так и редактора.
Я к чему это всё… с цитатами — проблема отдельная, а остальное уже надо решать регулярными выражениями. --newMitЁk 10:28, 7 марта 2013 (UTC)[ответить]
  • Ну, учитывать в автозамене цитаты с авторским написанием слов невозможно - именно поэтому у AWB, который эту автозамену использует, стоит пометка - проверяйте изменения перед сохранением. Теоретически, в английской справке написано что цитаты вообще не обрабатываются автозаменой, но не указано как именно он определяет где цитата а где нет. По поводу непосредственно регэкспа: "Лутш" и "Лушчыцкi" отсекаются, если указать в конце регэкспа (и|е), тем самым ограничив его применение словами типа лушче, лушчий, лушчие и так далее. Основная проблема - исправлять написание "лучче", но при этом не исправлять "Луччи" - и я не совсем представляю как это написать компактно, без расползания на два регэкспа, для "лучше" и для "лучший"/"лучшие" и так далее. --Mitas57 10:58, 7 марта 2013 (UTC)[ответить]
  • Предлагаю такое: <Typo word="лучший" find="\b(Л|л)у(тш|чщ|шч|чьш|дш|шш|шщ|щщ|щч)(и\B|е\b)" replace="$1учш$3" />. Конструкция в конце обрабатывает либо "и" не на конце слова, либо "е" на конце - так что Луччи пропускается. --Mitas57 11:18, 7 марта 2013 (UTC)[ответить]
  • Гм, нет. Значит, нужно ограничение что "и" не может быть в конце слова, а вот "е" - может быть и в конце и не в конце. (и\B|е). Еще хорошо бы учесть, что есть слова типа "улучшение", "улучшить" и подобные. Получится <Typo word="лучший" find="\b(У|у)?(Л|л)у(тш|чщ|шч|чьш|дш|шш|шщ|щщ|щч)(и\B|е)" replace="$1;2учш$3" />
Вот это поймать ещё не желаете :-) ? --Movses 12:17, 7 марта 2013 (UTC)[ответить]
  • Мда, это уже жестче. Я бы не взялся и это поймать и невинных выражений не наловить. И вообще, регэкспы же не всесильный инструмент :) --Mitas57 18:28, 7 марта 2013 (UTC)[ответить]

И снова «ответств»

[править код]

Нашлось ещё одно искажение — пропуск третьей «Т» (пример — «соответсвующим»), примерно 65 вхождений. Никто не натыкался? 92.242.86.133 19:11, 11 марта 2013 (UTC)[ответить]

Наткнулись. Добавились. Спасибо ! Аффтар пеши исчо :-) --Movses 06:28, 12 марта 2013 (UTC)[ответить]

Что-то «везёт» сочетанию «СТВ» на пропажи: «отсутсвие» (больше 30 вхождений) — похоже, непроизносимые согласные выпадают ещё и на письме... 149.62.3.233 18:20, 16 марта 2013 (UTC)[ответить]

Добавлено. Благодарствую. --Movses 20:32, 16 марта 2013 (UTC)[ответить]

Проблему с ТСТВ я закрыл на 99 % таким образом:

  1. Идём на сайт http://www.krossw.ru и забиваем маску *тств*
  2. Выцепляем нужное и формируем строку нужного вида для всех начальных букв
<Typo word="ТСТВ" find="(А|а)(бба|ген|гна|двока|дъюнк|дъютан|кроба|мана|нахоре|ристокра|рхимандри|спиран)т?ст?в" replace="$1$2тств" />

--Movses 09:19, 17 марта 2013 (UTC)[ответить]

лейтенат

[править код]

Ещё одна предлагаемая запись
(Л|л)ейтенат $1ейтенант 88.81.40.178 12:10, 22 марта 2013 (UTC)[ответить]

✔ Добавил, а заодно и замены для «летенант», «лейтинант», «лейтеннант» и подобного. — putnik 12:30, 22 марта 2013 (UTC)[ответить]

Путаница ш/щ

[править код]

Сообщать о таких ошибках или не надо? Что общего правила нет, понимаю, потому и спрашиваю. Если надо, вот первый случай: (Н|н)астояш(его|ий|ие|...) → $1астоящ$2 37.147.205.162 16:46, 2 апреля 2013 (UTC)[ответить]

  • Я вот не сторонник добавления редко встречающихся замен опечаток. Их проще один раз их поправить, чем захламлять список. А вот какие-то общие правила вполне можно. Например, для «ш» → «щ» можно добавить замену «-ншик» → «нщик» (там только «пуншик» исключение). Ну и вообще подумать, какие ещё есть паттерны. — putnik 17:56, 2 апреля 2013 (UTC)[ответить]
  • А я вот — сторонник. Сообщайте ещё ! --Movses 20:47, 2 апреля 2013 (UTC)[ответить]
  • Вы считаете, что не все ошибки следует заносить в данный список автозамен ? Я что-то не увидел никаких дисклеймеров на странице Википедия:AutoWikiBrowser/Typos. Хотите внести такой дисклеймер ? Может желаете его сформулировать поточнее ? --Movses 15:36, 3 апреля 2013 (UTC)[ответить]

Акт второй марлезонского балета (это про "хреначить"): (Б|б)лиз?жай[шщ](ий|ая|ое|…) → $1лижайш$2 37.147.207.122 15:11, 11 мая 2013 (UTC)[ответить]

✔ Добавил и исправил. Поиск вёл по "ближайщ*" и "близжа*". Спасибо. Кстати, вы могли бы зарегистрироваться ... --Movses 11:33, 12 мая 2013 (UTC)[ответить]

Растояние

[править код]

Огромное количество включений--Хомелка  :) / обс 06:27, 24 апреля 2013 (UTC)[ответить]

Поддерживаю включение в список для автоисправлений. --Pessimist 11:00, 24 апреля 2013 (UTC)[ответить]
✔ Сделано. Добавил и исправил. --Movses 19:10, 24 апреля 2013 (UTC)[ответить]

Котрансплантация

[править код]

Викификатор превращает медицинский термин «котрансплантация» в «которансплантация» :-) (на этой странице почему-то случается, только если выделить само слово). На странице обсуждения Викификатора сказано писа́ть сюда. DmitTrix 09:18, 23 мая 2013 (UTC)[ответить]

Это срабатывала замена для «котрая» → «которая», поправил. — putnik 09:24, 23 мая 2013 (UTC)[ответить]

«Ничего этого»

[править код]

<Typo word="ничего" find="\b(Н|н)и\s?че[го]{2}([^-бы]{3,3})" replace="$1ичего$3" /> неверно срабатывает на «ничего этого» и «ничего другого». Отключаю. KPu3uC B Poccuu 05:44, 27 июля 2013 (UTC)[ответить]

Оптимизация

[править код]

Использование символьных классов ускоряет обработку выражений, поэтому рекомендуется вместо (А|а) применять [Аа]. KPu3uC B Poccuu 08:35, 30 июля 2013 (UTC)[ответить]

Можно, чисто для расширения кругозора, пруфлинк на это утверждение ? --Movses 09:30, 30 июля 2013 (UTC)[ответить]
http://www.php.net/manual/ru/regexp.reference.performance.php. KPu3uC B Poccuu 11:56, 30 июля 2013 (UTC)[ответить]

Бангладеш 2

[править код]

Викификатор заменяет сочетание "в Бангладеше" на "вБангладеш". Пример - Виейра ди Меллу, Сержиу, Обсуждение:The Simpsons Hit & Run. Kalendar 12:15, 12 ноября 2013 (UTC)[ответить]

Да, есть такая проблема. В гаджете актуальные замены, но в что именно не так, пока не нахожу. — putnik 13:28, 12 ноября 2013 (UTC)[ответить]
✔ Исправлено, но правило пока вообще убрано из замен для Викификатора, надо будет думать, как корректно написать преобразование в JS-регекспы. — putnik 18:05, 14 ноября 2013 (UTC)[ответить]

нашлось в старом файле

[править код]

/// — собственно замены, после них комментарии

  • r/[Рр]а[ий]{1,2}сполком/$1айисполком/
Добавлено и исправлено. --Movses 19:22, 30 декабря 2013 (UTC)[ответить]
  • r/[Рр]екомм?енд/$1екоменд/
Добавлено и исправлено. --Movses 19:22, 30 декабря 2013 (UTC)[ответить]
  • r/[Уу]достоин/$1достоен/
Добавлено и исправлено. --Movses 19:22, 30 декабря 2013 (UTC)[ответить]
  • r/[Пп]ревоначаль/$1ервоначаль/
Добавлено и исправлено. --Movses 19:22, 30 декабря 2013 (UTC)[ответить]
  • r/[Сс]териотип/$1тереотип/ скорее всего, уже вычищено, но повтор возможен
Добавлено и исправлено. --Movses 19:22, 30 декабря 2013 (UTC)[ответить]
  • r/[фФ]ранцузк/$1ранцузск/
Хотя замена уже была, я её немного улучшил. --Movses 19:22, 30 декабря 2013 (UTC)[ответить]
  • r/[Кк]орр?еспон?ден/$1орреспонден/ !вариант с одной "р" встречается в украиноязычных фрагментах
  • r/[Пп]омош/$1омощ/ "помощь" и производные
  • r/[Оо]кк?упир/$1кк?упир/ оккупировать
  • r/[Оо]кк?упаци/$1ккупаци/ "оккупация" и производные
  • r/[Пп]аралл?ель/$1араллель/ ! но Паралельная

Там ещё 10 Кб слов с ошибками 149.62.8.217 11:00, 26 декабря 2013 (UTC)[ответить]

Спасибо ! С радостью посмотрим ваши 10 кб, если зальёте в википедию, например сюда. --Movses 11:34, 26 декабря 2013 (UTC)[ответить]
Залито; собственно слова под чертой, выше порция более менее однозначных замен, продублированы здесь:
  • r/[Вв]осемдесят\b/$1осемьдесят/ числительные надо бы в отдельной группе
  • r/[Вв]осемдесят\B/осьмидесят/ особенно порядковые
  • r/[Дд]естятысячн/$есятитысячн/
  • r/[Чч]етыремя/$1етырьмя/
  • r/[Тт]ринн?ад?цат/$1ринадцат/
  • r/[Аа]вгут/$1август/
  • r/[Аа]бб?р[ие]в[еи]атур/$1ббревиатур/ вроде уже было?
  • r/[Вв]аринт/$1ариант/
  • r/[Вв]сётаки/$1сё-таки/
  • r/[Гг]луюок/$1лубок/ опечатка б-ю
  • r/[Ии]нфркрасн/$1нфракрасн/
  • r/[Ии]стичени/$1стечени/
  • r/[Кк]омиси/$1омисси/
  • r/[Кк]онтр-атак/$1онтратак/
  • r/[Оо]бепокоен/$1беспокоен/
  • r/[Пп]лавнк/$1лавник/
  • r/[Пп]ригорд/$1ригород/
  • r/[Пп]оло[шщ]ад/$1лощад/
  • r/[Пп]рородител/$1рародител/
  • r/[Пп]р[еи]обрел\b/$1риобрёл/ !граница слова
  • r/[Пп]одданы/$1одданны/ !внимание на контекст
  • r/[Пп]оломник/$1аломник/ "половник" маловероятно, но возможно
  • r/[пП]роишестви/$1роисшестви/
  • r/[Сс]ред[ие]земномо?р/$1редиземномор/
  • r/[Тт]еме?п?ератур/$1емператур/
  • r/полога/полага/ лаг-лож,
  • r/Филл?ипп?ин/Филиппин/
  • r/резеден/резиден/
  • r/\Bних\b/ниях/ попытка отловить именно окончания: по идее \B должно отсечь "\bних\b" (местоимение после предлога)
  • r/обсулов/обуслов/

37.147.194.106 16:30, 28 декабря 2013 (UTC)[ответить]

Да, неслабый файлик, спасибо ещё раз ! Работы предстоит немало :) --Movses 22:47, 29 декабря 2013 (UTC)[ответить]

Оккупация

[править код]

Думаю, «оккупацию» нужно доработать-подправить. Примеры (при редактировании в AWB):

Замена "окупац" > "оккупац" нормально работает если убрать лишний знак вопроса. ✔ Сделано (diff) --Movses 19:28, 30 декабря 2013 (UTC)[ответить]

ценральный

[править код]

Было find="\b([Цц])етр(\w*)\b" replace="$1ентр$2". Чтобы ловило как в заголовке, надо find="\b([Цц])е(тр|нр)(\w*)\b" replace="$1ентр$3" 92.242.90.246 02:32, 18 мая 2014 (UTC)[ответить]

Штуттгарт → Штутгарт

[править код]

С одним "т". --Fedor Babkin talk 18:13, 19 июня 2014 (UTC)[ответить]

Хочу заменить ссылки на шаблон

[править код]

Хочу заменить ссылки типа [http://twitter.com/(*)/status/(*) (*)] [https://twitter.com/(*)/status/(*)] [http://twitter.com/(*)/status/(*)] [https://twitter.com/(*)/status/(*)] на шаблон ((Твиттер)) в своей вики. Как это можно сделать в AWB??

Dimon4ezzz (обс.)

17:13, 23 августа 2014 (UTC)

афициальный

[править код]

Работа над ошибками от Яндекса утверждает, что так тоже ошибаются 88.81.43.41 16:53, 14 января 2015 (UTC)[ответить]

В википедии "афициальный" я не нашёл, но модицифировал регулярное выражение, авось когда поймаем. --Movses 08:43, 15 января 2015 (UTC)[ответить]

Викификатор некорректно обрабатывает такие случаи. --Insider 51 11:50, 24 февраля 2015 (UTC)[ответить]

  • Викификатор берёт замены не из этого списка, ответственность за корректное составление списка для викификатора - на составителе того списка. АВБ делает здешние замены только в полуручном режиме, оператор должен отслеживать подобные случаи. × Не сделано MaxBioHazard 17:54, 21 мая 2015 (UTC)[ответить]

"Начнется" и "самопровозглашенный"

[править код]

Прошу сделать так, чтобы при викификации текста слово «начнется» заменялось на «начнётся», а «(само)провозглашенный» (-ая и прочие окончания) — на «(само)провозглашённый». Кадош 20:57, 22 марта 2015 (UTC)[ответить]

Перенесено со страницы Обсуждение участника:NBS. NBS 22:42, 16 мая 2015 (UTC)

В режиме исправления Typos'ов в АВБ нельзя включить полный автомат, в нём работает только ручное сохранение каждой правки после предпросмотра диффа. Исходя из этого, подобные замены, неадекватные в других языках, в списке оставляются, т.к. предполагается, что правщик увидит дифф перед сохранением правки и не станет его сохранять. Не понравившаяся вам правка не могла быть совершена через АВБ, т.к. отключить добавление в описание правки текста "с помощью АВБ" можно только с учётки со флагом бота, кроме того правка вообще немассовая. Возможно, это сделал викификатор, но у него свой список замен, лежащий в его js-файле, он не берёт замены из АВБшного списка. На основании вышенаписанного предлагаю восстановить удалённую вами замену. MaxBioHazard 12:09, 3 мая 2015 (UTC)[ответить]

Насколько я понимаю, Putnik обновляет гаджет скриптом, а специальной отметки «только для ботов, в гаджет не переносить» в ВП:Typos не предусмотрено. Кроме того, есть достаточно много примеров, где это срабатывает некорректно и в русском тексте — всевозможные названия организаций, групи…; в то же время, некоторые нужные автозамены не проводились (например, в русском тексте «групой» → «группой»). Думаю, что эта замена достаточно сложная, поэтому её лучше периодически производить отдельным проходом по результатам поиска. NBS 18:53, 3 мая 2015 (UTC)[ответить]
Да, переношу скриптом, копируются все правила, которые можно воспроизвести при помощи регулярных выражений на JS. — putnik 18:58, 3 мая 2015 (UTC)[ответить]

Комунерос

[править код]

Не могу составить правило для исключения слова комунерос. Сделал было так (К|к)ом+ун+(?!ерос), но оно не работает. Тут бы пригодился свержадный квантификатор (К|к)ом++ун++(?!ерос), но они не поддерживаются. Есть идеи? Игорь Темиров 13:12, 21 июля 2015 (UTC)[ответить]

дествительно - дйствительно

[править код]

Викификатор заменяет «дествительно» на «дйствительно». Kalendar 09:40, 29 января 2016 (UTC)[ответить]

Здесь я исправил, а вот у викификатора это надо бы написать на страницу Обсуждение Википедии:Викификатор. --Movses 10:01, 29 января 2016 (UTC)[ответить]

Комунига

[править код]

т.к. Обсуждение Википедии:Викификатор посылает сюда ...

Викификатор заменяет «Комунига» на «Коммунига», что неправильно--User№101 22:09, 26 февраля 2016 (UTC)[ответить]

Война правок

[править код]

По поводу правила "Коммунизм". Я понял, коллега, что не понимаете, потому и написал, тренируйтесь в личном пространстве. Я вернул страницу к консенсусной версии от 10 февраля и начинать обсуждение должны вы, а не я. Претензии изложены в комментариях к правкам. Что я должен к ним добавить? Лишь то, что, если видите работающее правило, не стоит ломать его, а постараться модернизировать. В данном случае, например, возможен такой вариант: find="\b(К|к)ом+ун+(?!ерос|иг)", но вы предпочли сделать из одного работающего правила два, причём одно из них неработающее. Я уже не раз, как вы помните, правил за вами новые правила, но в данном случае, когда вы ломаете старые, счёл правильным этот путь исправления. Игорь Темиров 05:05, 28 февраля 2016 (UTC)[ответить]

Устаревшие параметры

[править код]

Предлагаю добавить в автоисправление удаление устаревших параметров шаблона ((НП)) (размер карты (страны/региона/района) и ЯндексКарта). Гонять ради них бота жалко, а вот если добавить сюда, то небольшими темпами оно частично будет вычищено вместе с сопутствующими правками. -- dima_st_bk 07:56, 2 мая 2016 (UTC)[ответить]

Поддерживаю. --Insider 51 06:32, 12 сентября 2016 (UTC)[ответить]

четыремя → четырёмя

[править код]

AWB предлагает вот такую странную замену: четыремя → четырёмя. -- NZeemin (обс) 21:26, 19 июля 2016 (UTC)[ответить]

  • А первое слово существует? Список не обязан корректно обрабатывать несуществующие слова; он пишется в расчёте на существующие. MBH 23:10, 19 июля 2016 (UTC)[ответить]
  • Вы исключили из обработки сложные слова типа «четырёхэтажный» — пожалуйста, верните. А слово «четыремя» разве существует, что ради него надо что-то менять? Должно быть «четырьмя», не? DmitTrix (обс) 07:30, 20 июля 2016 (UTC)[ответить]
P.S.: попросил ботоводов заменить «четыремя» на «четырьмя». DmitTrix (обс) 08:04, 20 июля 2016 (UTC)[ответить]
  • Должно быть OK. Убрал одну пару скобок — запоминание этой «группы» (пустой или состоящей из одного символа «е») не нужно. DmitTrix (обс) 12:03, 20 июля 2016 (UTC)[ответить]

Клиппертон

[править код]

Превращает Клиппертон в Клипертон. --Insider 51 06:32, 12 сентября 2016 (UTC)[ответить]

Уточнение: превращает Остров Клиппертон в Остров Клипертон (не меняет название статьи, но меняет отображаемый текст). Kalendar (обс) 06:36, 12 сентября 2016 (UTC)[ответить]
Участник:Jack who built the house. Oleg3280 (обс.) 07:55, 21 июля 2019 (UTC)[ответить]

Викификация слов с ударением

[править код]

Текст с ударением в преамбуле: Викификатор превращает «Коэффицие́нт рассе́яния» в «Коэффицие́нт расе́яния». Kalendar (обс) 07:09, 12 сентября 2016 (UTC)[ответить]

агентство

[править код]

Надо убрать дубль из секции А — есть в секции ТСТВ 92.242.79.77 19:59, 16 ноября 2016 (UTC)[ответить]

Коммунарский район

[править код]

Вот здесь (правки) викификатор отработал некорректно. Поскольку существует корректное слово укр. Комунарський, то предлагаю в коде MediaWiki:Gadget-wfTypos.js исправить строку

r( /((?:^|\s)[Кк])ом+ун+(?!ерос)/g, '$1оммун' );

на

r( /([^іїєґІЇЄҐ]{100}(?:^|\s)[Кк])ом+ун+(?!ерос)([^іїєґІЇЄҐ]{100})/g, '$1оммун$2' );

Я проверил регулярку с помощью https://regex101.com/#javascript и проблем не увидел. --Movses (обс) 18:46, 17 августа 2016 (UTC)[ответить]

Буква ё

[править код]

Добрый день! Скажите, пожалуйста, викификатор умеет заменять е на ё? Здесь написано что да, однако у меня (Google Chrome 55) этого не происходит (по крайней мере на тексте "Найдем зеленый цвет"), хотя другие функции работают (в частности замена "т.е." на "то есть"). Спасибо! Дима74 (обс.) 18:24, 27 января 2017 (UTC)[ответить]

Молодёжь

[править код]

Предлагаю добавить в гаджет исправления орфографии слово «молодёжь» и все производные. С белорусским, болгарским и украинским нежелательных совпадений нет, я проверил. Могу ошибаться, но выглядеть это должно так:

r( /((?:^|\s)[Мм])олодеж/g, '$1олодёж' );

Или так:

r( /((?:^|\s)[Мм])олодеж(\w+)(?=[^A-ZА-ЯЁa-zа-яё́ъ|$)/g, '$1олодёж$2' );

Krokusse (обс.) 03:23, 1 февраля 2017 (UTC)[ответить]

Вторая регулярка выглядит более безопасно, но она не ловит "науч.-практ. молодеж. конф." И обе регулярки не ловят "Техника-Молодежи" и "(молодежь)". Также не ловятся "«Молодежь Эстонии»", "«Молодежь Алтая»", хотя кавычки лучше и не ловить — вполне возможно, что в оригинале имя собственное без "ё". --Movses (обс.) 09:22, 1 февраля 2017 (UTC)[ответить]

AWB не превращает <br /> → <br>. Почему? Включены Typos. Пришлось копировать код замены br’ов вручную в «поиске и замене».  ← ALEX GREAT [обсуждение] 05:02, 22 мая 2017 (UTC)[ответить]

Я надеюсь, вы не одну эту сверхмелкую правку сохраняете? MBH 10:01, 22 мая 2017 (UTC)[ответить]
О чём вы говорите? Вы думаете, что я захожу в АвтоВикиБраузер, чтобы вручную вписать туда код замены br’ов, пройтись по статьям и заменить исключительно их? Мне проще было бы это делать через Википедию, где викификатор с этим прекрасно справляется. Поэтому мой ответ — да, я сохраняю правку с другими необходимыми изменениями (вычищал ненужные флаги из карточек, можете посмотреть в моё вкладе).  ← ALEX GREAT [обсуждение] 02:43, 26 мая 2017 (UTC)[ответить]

Ёфикация

[править код]

Просьба добавить замену таких слов: шахтер → шахтёр, молодежный → молодёжный, партнер → партнёр, провел → провёл, прошел → прошёл, пришел → пришёл, перешел → перешёл. Спасибо. — Mitte27 (обс.) 22:19, 31 января 2018 (UTC)[ответить]

(Добавлено в список техзадач на будущее)

Этот невидимый раздел используется для формирования ссылок на разделы на странице поиска. Тхздч 2018-02-08: Добавить ёфикацию в викификатор. Mitte27. /Тхздч.

Теплый → тёплый, ночевка → ночёвка, береза → берёза, днем → днём. — Оркрист 01:05, 25 июня 2019 (UTC)[ответить]

Замены с учётом иных языков

[править код]

Есть некоторые проблемы с заменами из этой группы:

  1. они не попадают в викификатор
  2. (вроде бы) если два слова находятся на расстоянии меньше 200 символов, то будет обработано только одно из них

Предлагаю изменить эти замены с использованием lookahead и lookbehind. Например, замену "учасник → участник":

<Typo word="участник" find="([^іїєґІЇЄҐuk]{100,100}\b)([Уу])часник([^іїєґІЇЄҐ]{100,100})" replace="$1$2частник$3" />

изменить вот так:

<Typo word="участник" find="\b(?<=(?:[^іїєґІЇЄҐuk]|^){100})([Уу])часник(?=(?:[^іїєґІЇЄҐuk]|$){100})" replace="$1частник" />

Это позволит решить вторую проблему (если она есть, конечно) и когда-нибудь в будущем первую. Дима74 (обс.) 18:30, 2 апреля 2019 (UTC)[ответить]

Добавьте, пожалуйста, намек → намёк. Здесь был Вася 1234qwer1234qwer4⇝обс⇜⇝вклад⇜ 11:37, 18 августа 2019 (UTC)[ответить]

Typo word="манёвр"

[править код]

а слово "манёвренный" у вас без ё будет ?

оффицер → офицер

[править код]

странно это, учитывая что в реальности их officer это офисный работник (тот кто работает в office), а совсем не наш офицер

Цетрария

[править код]

Исправление орфографии неправильно срабатывает на статье Цетрария исландская. К сожалению, я не понимаю, почему там ошибочно срабатывает (ведь исключение прописано), потому просьба посмотреть более подкованным людям. — Movses (обс.) 21:13, 26 декабря 2019 (UTC)[ответить]

  • Movses, я посмотрела, это не только в исландской, но и в других цетрариях тоже не работало. Там в исключении не был прописан вариант со строчной буквой и с ударением. Добавила, вроде работает, и в викификаторе тоже обновила. К слову, надо бы везде ударные буквы проверить. — Alexandrine (обс.) 13:30, 12 июля 2020 (UTC)[ответить]

Мягкий ЧЬ

[править код]

Встретил ошибку "передачь". Понятно, что произносим мягко, а пишем без мягкого знака. Конкретно эта ошибка встречается не часто (всего 2 раза), потому не добавлял в список автозамен. Но есть чуйка, что если поискать по дампу, то найдётся таких ошибок не одна и тогда можно будет добавить в список автозамен. — Movses (обс.) 22:37, 28 декабря 2019 (UTC)[ответить]

Непонятно как различать с такими словами как "ночь", "прочь", "речь". Дима74 (обс.) 14:02, 29 декабря 2019 (UTC)[ответить]

на протяжение → на протяжении

[править код]

Исправил около двуж сотен случаев; по-моему, достаточно для включения в список. Здесь был Вася 1234qwer1234qwer4⇝обс⇜⇝вклад⇜ 22:20, 15 июня 2020 (UTC)[ответить]

брошурі → брошюрі

[править код]

Ошибочно исправляет украинское брошура (в польській брошурі исправляет на в польській брошюрі). Radmir Far (обс.) 07:09, 4 сентября 2021 (UTC)[ответить]

Тем не менее

[править код]
Перенесено со страницы Обсуждение Википедии:Викификатор#Тем не менее. — putnik 20:33, 25 декабря 2021 (UTC)

Я сделал запрос к ботоводам, запрошу и здесь. Встретил два раза подряд ошибку (и исправил её) в выражении: тем ни менее вместо правильного тем не менее. Если этого ещё нет в коде викификатора, предлагаю добавить. — 217.197.250.65 19:05, 4 июля 2020 (UTC)[ответить]

Использование в других проектах

[править код]

Коллеги, правильно ли я понимаю, что для того, что бы всё представленное здесь работало в ру-викиновостях, нужно перетащить это в викиновости? VladimirPF (обс.) 11:19, 20 февраля 2022 (UTC)[ответить]

привело→привёло

[править код]

Уберите из автовикифкатора эту замену.— Inctructor (обс.) 12:44, 12 августа 2023 (UTC)[ответить]

Единственен

[править код]

Викификатор заменяет корректное «единственен» на некорректное «единственнен», хорошо бы поправить, bezik° 20:30, 24 сентября 2023 (UTC)[ответить]

<ref>[//site.com ... km2 ...]</ref>

[править код]

Заменяет «km2» внутри ref, нужно отключить. ~~‍~~ Jaguar K · 17:41, 8 декабря 2023 (UTC)[ответить]

Неверные наращения числительных

[править код]

@Gromolyak, приветствую. В вашей реализации появился баг, меняющий:

  • ой_ → ой-й_
  • ою_ → ою-ю_
  • ое_ → ое-е_
  • ом_ → ом-м_
  • ого_ → ого-го_
  • ому_ → ому-му_
  • ая_ → ая-я_
  • ую_ → ую-ю_
  • ий_ → ий-й_
  • им_ → им-м_
  • их_ → их-х_
  • ими_ → ими-ми_
  • ем_ → ем-м_
  • ей_ → ей-й_
  • ею_ → ею-ю_
  • его_ → его-го_
  • ему_ → ему-му

Просьба поправить или откатить. Solidest (обс.) 20:48, 29 мая 2024 (UTC)[ответить]

  • Здравствуйте! Не совсем вас понял. Для замены обязательно наличие цифр и дефиса, но даже с ними не смог подобрать примера, приводящего к неправильной замене. Не могли бы вы привести хотя бы один такой пример?

На всякий случай — последние по дате изменения регулярное выражение и строка замены в скрипте —

"\b(\d+)-(?:(?:ы([ймех]|ми))|(?:о([йюем]|го|му))|(?:а(я))|(?:у(ю))|(?:и([ймх]|ми))|(?:е([мйю]|го|му)))\b"

и

"$1-$2$3$4$5$6$7"

Gromolyak (обс.) 22:41, 29 мая 2024 (UTC)[ответить]

  • Эту регулярку на днях добавили в викификатор и она стала вызывать подобные ошибки: [5], [6], [7], и тд. Сам не уверен почему она реагирует только на нижнее подчеркивание. Возможно проблема возникает в связи с чем-то ещё, но появилась она ровно в день этой правки. Solidest (обс.) 22:50, 29 мая 2024 (UTC)[ответить]
    • В начале регулярного выражения присутствует "(\d+)-", что означает одну или несколько цифр, а следом — дефис, они являются обязательными для того, чтобы шаблон сработал. Если в тексте их нет — выражение сработать не может ни при каких прочих условиях, что и было мной проверено раньше, когда с помощью AWB и этого выражения я заменил множество (несколько тысяч) ошибочных наращений, при этом не было ни одной жалобы. Кроме того, вот эта правка https://ru.wikipedia.org/w/index.php?title=%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:AutoWikiBrowser/Typos&diff=prev&oldid=135455251 участника Putnik показывает, что он не увидел ничего подозрительного в выражении, а, по слухам, он является специалистом в этой области. Кстати, и подчёркивания в рег. выр. нет, ни нижнего, ни верхнего. Gromolyak (обс.) 02:28, 30 мая 2024 (UTC)[ответить]
    • Кстати, добавленная версия не соответствует моей и вообще не может правильно работать, так как первая скобка, которой не было, захватывает и копирует всё исходное выражение и ставит его перед дефисом, что уже неверно.

Правильная версия:

\b(\d+)-(?:(?:ы([ймех]|ми))|(?:о([йюем]|го|му))|(?:а(я))|(?:у(ю))|(?:и([ймх]|ми))|(?:е([мйю]|го|му)))\b

Добавленная неправильная версия:

((?:^|\s)(?:\d+)-(?:(?:ы([ймех]|ми)))|(?:о([йюем]|го|му))|(?:а(я))|(?:у(ю))|(?:и([ймх]|ми))|(?:е([мйю]|го|му)))\b

Не могу себе представить, что скрипт произвёл такую замену, так как при этом он поменял захватывающие скобки на незахватывающие ("(\d+)" на "(?:\d+)"), а также произвольно поместил всё выражение ещё в пару захватывающих скобок, чего быть не должно. Похоже, будто кто-то неправильно изменил выражение вручную. Копирование выражения без модификаций, без сомнений, решит проблему. Gromolyak (обс.) 02:57, 30 мая 2024 (UTC)[ответить]

Прошу исправить её. Gromolyak (обс.) 13:05, 1 июня 2024 (UTC)[ответить]

{{bottomLinkPreText}} {{bottomLinkText}}
Обсуждение Википедии:AutoWikiBrowser/Typos
Listen to this article

This browser is not supported by Wikiwand :(
Wikiwand requires a browser with modern capabilities in order to provide you with the best reading experience.
Please download and use one of the following browsers:

This article was just edited, click to reload
This article has been deleted on Wikipedia (Why?)

Back to homepage

Please click Add in the dialog above
Please click Allow in the top-left corner,
then click Install Now in the dialog
Please click Open in the download dialog,
then click Install
Please click the "Downloads" icon in the Safari toolbar, open the first download in the list,
then click Install
{{::$root.activation.text}}

Install Wikiwand

Install on Chrome Install on Firefox
Don't forget to rate us

Tell your friends about Wikiwand!

Gmail Facebook Twitter Link

Enjoying Wikiwand?

Tell your friends and spread the love:
Share on Gmail Share on Facebook Share on Twitter Share on Buffer

Our magic isn't perfect

You can help our automatic cover photo selection by reporting an unsuitable photo.

This photo is visually disturbing This photo is not a good choice

Thank you for helping!


Your input will affect cover photo selection, along with input from other users.

X

Get ready for Wikiwand 2.0 🎉! the new version arrives on September 1st! Don't want to wait?