Каким образом можно вытащить текст со страницы и проанализировать его? php

интернет компьютеры программирование php

Собствено интересует, как делают контекстный поиск скажем? Если информация идет не с базы данных. Ну самая простая реализация.
В общем с помощью чего и как это делается на php?

Примечание:
Ashgo, я не про это. Как посредством пхп вытащить со страницы контекст и работать с ним.
Wolfy-J, за счет чего идет сильная загрузка? Скажем если будет анализироваться 2-3 страницы. Думаю это не будет слишком громоздко.

Примечание:
А как тут можно использовать сокеты? Т.е. принимать контент каким то образом?

Примечание:
Благодарю, пока информации достаточно...
Ответы:
Зависит от браузера, в основонм правой кнопкой кликаем, далее по наитию смотрим исходный код HTML/
Если имеется ввиду РНР код, с помощью которого была страница сгенерирована, то никак, т.к. работает интерпритатор на сервере и обойти его можно только скачав сам файл по ftp
Хмм... не хочу повторятся про сокеты и получение содержимого страницы, думаю в данном случае даже лучше использовать CURL...
Затем уже анализируется содержимое страницы, можно вырезать все теги и посчитаь наиболее частые слова. Однако заниматся такими вещами в одиночку не советую, не даром ведь гугл и яндек угрохали столько средств. Возможно вы и получите результат, но цено огромной базы либо загруженного ЦП...
f.e. fopen & fread
Заранее извиняюсь за отсуствие некоторых букв, моя клавиатура пережила мытьё в душе...
Дополнение #2, посылать запросы и принимать данные используя HTTP.


16 лет назад

RPI.su - самая большая русскоязычная база вопросов и ответов. Наш проект был реализован как продолжение популярного сервиса otvety.google.ru, который был закрыт и удален 30 апреля 2015 года. Мы решили воскресить полезный сервис Ответы Гугл, чтобы любой человек смог публично узнать ответ на свой вопрос у интернет сообщества.

Все вопросы, добавленные на сайт ответов Google, мы скопировали и сохранили здесь. Имена старых пользователей также отображены в том виде, в котором они существовали ранее. Только нужно заново пройти регистрацию, чтобы иметь возможность задавать вопросы, или отвечать другим.

Чтобы связаться с нами по любому вопросу О САЙТЕ (реклама, сотрудничество, отзыв о сервисе), пишите на почту [email protected]. Только все общие вопросы размещайте на сайте, на них ответ по почте не предоставляется.