2008-08-30 19:59:36
数日前にAmazon ECS(旧称)から返ってくる情報を正規表現で処理して一人悦に入っていたわけだが、今日はこんな記事(「金魚撥の技術メモ:Google App EngineでWEBサービスを使う」)を見かけたので、真似してみた。でも、できなかった。どうして他のみんなはできるのに自分だけできないんだろうと気分が沈んだ。
いや、Amazon ECS(旧称)はそんなことしなくていいんだから、もっと新しいことを考えよう。今日はTechnoratiのAPIを利用してみよう。もちろん、Google App Engineで。今日もElementTreeを試してみて失敗。でも、こっちには正規表現があるんだと思って、Amazon ECS(旧称)と同様の方法で処理したんだが……できなかった。なぜだ。AttributeError: 'NoneType' object has no attribute 'group'なんてエラーが出るのだ。変だなと思って、Technoratiから返ってきたXML文書を保存してローカルでターミナルからpythonで処理してみるとちゃんと目的のタグの間を抜き出せるのだが。ただ、findallはうまく動かなかった。まったく理解できない。これで、何時間も空しい時間が流れてしまった。一度始めると気になってなかなか止められない。そういう性格なのだ。
Technoratiだと一回に100件まで受け取れるし、キーワードを含む文書件数の時間経過も提供してくれたり、いろいろ興味深いのに。
自宅サーバでPHPを使ったスクリプトを書けば簡単に処理できるような気はするのだが、今はいろいろとGoogle App Engineで動かせるように調べる期間なので、そう簡単には引き下がれない。