Yahoo Pipesはクセがある

検索結果にGoogle書籍検索のリンクがある場合には更新のたびに登録されるというバグがGoogle Scholar RSSにあったため修正した。URLの中に乱数?のようなものがあるためRSSのIDがユニークにならなかったことが原因。幸いURLの一部のパラメータを単純にカットすれば良いので正規表現モジュールにルールを追加するだけでいいはずなのだが、書いた正規表現がなかなか通らない。

具体的にはURLの中にある「&ots=.+&sig=.+」をカットしたいのだが、このまま書いてもマッチされない。いろいろ試した結果、「\x26amp;ots=.+\x26amp;sig=.+」なら通ることが判明。分からないよ…。