Сам скрипт почти готов и имеет такой вид:
#!/bin/bash
player="smplayer"
file="$1"
link=$(cat $file | grep http:// | grep mp4 | awk -F ',' '{ print $1 }' | awk '{ print $2 }' )
$player $link
но вывод переменной $link не идеальный и оставляет двойные скобки в ссылке из-за чего все плееры её не загружают.
После парсинга html файла с помощью grep получается такой вывод:
user@finn-desktop:~$ cat page.htm | grep http:// | grep mp4
file: "http://serials.tulavideo.net/CM/CM-01-01.mp4",
user@finn-desktop:~$
а после добавления команды awk (что она делает я не знаю, просто стащил с другого скрипта) строчка получает такой вид:
user@finn-desktop:~$ cat page.htm | grep http:// | grep mp4 | awk -F ',' '{print $1}' | awk '{ print $2 }'
"http://serials.tulavideo.net/CM/CM-01-01.mp4"
user@finn-desktop:~$
Как избавиться от двойных скобок в ссылке? Или как правильно распарсить страницу?
Примечание:
> и причем тут HTML?
В принципе не причем... но технически я имею дело с html файлом.
Примечание:
> А если речь про кавычки, так с ними проблем не бывало. У mplayer'а уж точно.
Точно, кавычки )) Totem и SMplayer не хотят кушать ссылки с кавычками и говорят следующее:
user@finn-desktop:~$ sh vid.sh page.htm
** Message: Error: Ресурс не найден.
gstfilesrc.c(1055): gst_file_src_start (): /GstPlayBin2:play/GstURIDecodeBin:uridecodebin0/GstFileSrc:source:
No such file "/home/user/"http:/serials.tulavideo.net/CM/CM-01-01.mp4""
а при убирании кавычек все в норме.
Примечание:
Если totem'у так задать:
user@finn-desktop:~$ totem "http://serials.tulavideo.net/CM/CM-01-01.mp4"
то проблем нет, грузит-играет, а в скрипте не хочет...
Примечание:
Добавил echo перед последней строчкой, получил такой вывод:
user@finn-desktop:~$ sh vid.sh page.htm
totem "http://serials.tulavideo.net/CM/CM-01-01.mp4"
вроде ничего криминального, но работать не хочет.
Можете сами убедиться
http://dl.dropbox.com/u/1577199/vid.tar.gz (в архиве страница и скрипт)
Примечание:
Pharmakis, как нет запятой? Посмотрите первый вывод grep, в конце как раз есть запятая.
Про плееры и кавычки: методом проб и ошибок было выявлено почему плееры не подхватывают ссылки, а потому что ни пойми как на выходе стандартные двойные кавычки «"» еще раз выделяются одинарными «'». И на такую ссылку:
'"http://serials.tulavideo.net/CM/CM-01-01.mp4"'
даже wget ругается, не то что плееры. Вот почему необходимо как-то удалить двойные.
RPI.su - самая большая русскоязычная база вопросов и ответов. Наш проект был реализован как продолжение популярного сервиса otvety.google.ru, который был закрыт и удален 30 апреля 2015 года. Мы решили воскресить полезный сервис Ответы Гугл, чтобы любой человек смог публично узнать ответ на свой вопрос у интернет сообщества.
Все вопросы, добавленные на сайт ответов Google, мы скопировали и сохранили здесь. Имена старых пользователей также отображены в том виде, в котором они существовали ранее. Только нужно заново пройти регистрацию, чтобы иметь возможность задавать вопросы, или отвечать другим.
Чтобы связаться с нами по любому вопросу О САЙТЕ (реклама, сотрудничество, отзыв о сервисе), пишите на почту [email protected]. Только все общие вопросы размещайте на сайте, на них ответ по почте не предоставляется.