Keep It MECE

あったこと、気になったこと、知っておきたいこと

Qiitaのページからタイトルを取得する

urlsというテキストファイルを作成します。

urls

http://qiita.com/leo1109/items/045c54d9a3a4f8979cc2

run.sh

#!/bin/bash
for url in `cat urls`;
do
    title=`curl ${url} 2>&1 | grep '<h1' | perl -e '$x=<STDIN>;chomp $x;if ($x =~ /(\<h1 class=\"ArticleMainHeader__title\".*?\>)(.*?)\</){print $2;}'`
    echo $title, $url
done

run.shを実行します。 以下の様に、記事のタイトル、URLが出力されます。

Pythonで書きたい! (1) コードのフォーマットチェック, http://qiita.com/leo1109/items/045c54d9a3a4f8979cc2