Qiitaのページからタイトルを取得する
urlsというテキストファイルを作成します。
urls
http://qiita.com/leo1109/items/045c54d9a3a4f8979cc2
run.sh
#!/bin/bash for url in `cat urls`; do title=`curl ${url} 2>&1 | grep '<h1' | perl -e '$x=<STDIN>;chomp $x;if ($x =~ /(\<h1 class=\"ArticleMainHeader__title\".*?\>)(.*?)\</){print $2;}'` echo $title, $url done
run.shを実行します。 以下の様に、記事のタイトル、URLが出力されます。
Pythonで書きたい! (1) コードのフォーマットチェック, http://qiita.com/leo1109/items/045c54d9a3a4f8979cc2