Как сравнить текстовые файлы не построчно?

текст сравнение

Есть 2 текстовых файла разного размера. К примеру, в них содержатся названия географических объектов, списки не сортированы по алфавиту. Нужно произвести поиск в 2х документах, найти одинаковые названия, и выдать результат с ними(со списком одинаковых слов). (выстраивать названия по алфавиту - не предлагать)

Примечание:
2 gfan
Спасибо за мысль, хоть и это несколько неудобно (обрабатывать огромный получившийся список) + в таком случаи придется озадачится поиском программ, которые будут сравнивать длину слов.

2 adav84
Тоже спасибо. Спрашивал, как пользователь.

Примечание:
2 PetSerAl
Формат файлов: "TXT". Но смотрите сами по поводу написания, задача у меня одноразовая, 2й раз, врятли, мне придется заняться этим еще раз в ближайшем будущем.

Примечание:
Каждый элемент с новой строки. Если на одной строке находится 2 слова, то разделены они пробелом.

Примечание:
Как запустить этот скрипт? Что я сделал: 1. создал текстовый файл в него вложил то, что Вы написали, и переименовал расширение файла в "ps", 2. установил Windows PowerShell, 3. При попытке запустить (написал полный адрес файла со скриптом), мне выдается ошибка:
"Ошибка при выполнении программы "PoewerShellScript.ps": указанному файлу не сопоставленно ни одно приложение для выполнения данной операции.
строка:1 знак:26
+ E:\22\PoewerShellScript.ps <<<<
строка:1 знак:1
+ <<<< E:\22\PoewerShellScript.ps
+ CategoryInfo : ResourceUnavailable: (:) [], ApplicationFailedException
+ FullyQualifiedErrorId : NativeCommandFailed ."
Все это запускал на Windows XP.

Примечание:
Большое спасибо, все работает.
Ответы:
gawk. что-нибудь типа:
FILENAME==ARGV[1]{a[$0]++; next}
FILENAME==ARGV[2]&&($0 in a)
а вообще, любой скриптовый язык (в т.ч. пхп) сойдет.
Могу написать скриптик на PowerShell, если опишите формат файлов.
Как разделены элементы списка: через пробел, зяпятую или каждый элемент с новой строки?
Если на одной строке находятся несколько слов, то это один элемент или несколько элементов?
В результате Вам нужен просто список элементов, которые встречаются в обоих списках?
Если несколько слов в строке означает несколько элементов и Вам нужен только список общих слов в обоих списках, то вот скриптик:
1) Файлы скриптов PowerShell имеют расширение ps1 а не ps.
2) Создавать файл скрипта не обязательно. Можно просто вставить команду в командную строку.


13 лет назад

RPI.su - самая большая русскоязычная база вопросов и ответов. Наш проект был реализован как продолжение популярного сервиса otvety.google.ru, который был закрыт и удален 30 апреля 2015 года. Мы решили воскресить полезный сервис Ответы Гугл, чтобы любой человек смог публично узнать ответ на свой вопрос у интернет сообщества.

Все вопросы, добавленные на сайт ответов Google, мы скопировали и сохранили здесь. Имена старых пользователей также отображены в том виде, в котором они существовали ранее. Только нужно заново пройти регистрацию, чтобы иметь возможность задавать вопросы, или отвечать другим.

Чтобы связаться с нами по любому вопросу О САЙТЕ (реклама, сотрудничество, отзыв о сервисе), пишите на почту [email protected]. Только все общие вопросы размещайте на сайте, на них ответ по почте не предоставляется.