Mashup Award 4thに応募しました

小生北海道ボケが抜けてませんが皆様いかがお過ごしでしょうか。

さてMashup Award 4thの締め切りが昨日(9/16)でした。
なんか新しく作ろうかとも思ったんですがほどよいネタがなかったのですでにある物を。
アウトドア用品価格比較をそのまま出しました。

利用しているAPIは以下の通り。

メジャーなAPIばっか使ってるので賞を狙えるかどうかは微妙なところですがまあ出すだけ出すかと。

ちょっと機能とかその中身とかを簡単に説明してみたいと思います。

価格比較

スゲーわかりやすい機能。説明の余地なし。
それでも分からない人に贈る言葉はアウトドア用品版価格コム。

価格情報はYahoo!ショッピングのウェブサービスと楽天商品検索から取得。
あとそういうAPIにデータを乗せていないところは独自にスパイダ(ロボット・クローラー)を作って対応してます。

しかし昔気質のウェブサイトのスパイダリング/スクレイピングは地獄だぜフゥハハハーハァー。
変に今かぶれしたJavaScript使いまくりサイトとかもですけどね。AJAXとハサミは使いどころを選んでくださいよ?
ちなみに古のウェブサイトは古の技が一番よく効きます。正規表現とかすごいですよね。 お上品なパーサーに例外を食らわせるような無頼なページも一撃です。

ところで価格比較サイトなんて作るの簡単だぜ!と思っていたけれど実際取り組んでみると意外とやっかいなのが各ショップで売ってるアイテムを同一のアイテムと判別すること。
例えば次のように販売ページのタイトルとかがショップごとにまちまちなんです。

  • ショップA ふーばー ほげほげテント 湯たんぽふたつおまけ!
  • ショップB 【送料無料】ふーばーほげほげテント
  • ショップC HPとMPがたちまちマックスに! foobar ほげほげテント

各販売ページのタイトルや商品名のパターンでがんばって判別しようとしてますけど誤判別とかまだあります。
可能ならばメーカーの型番でマッチさせるのがいい感じですが、その型番をデータとして持ってるショップばかりでもないのが困ったものだったりします。

ブログから口コミ収集

ブログ検索から記事を収集したら口コミ情報として使えるのでは。
そんな風に思っていた時期が俺にもありました。

実際やってみて当初の思惑と比べると期待はずれ度80%くらいでした。
ノイズだらけ。
スパムを排除してもなお役に立つ記事は少ないと言う。

一応テキスト解析とかで重み付けをうまくできたりすれば使えるようになるかもしれないので捨ててはいません。
役に立つ情報もあることはありますし。
逆に考えるとこういうノイズを適切にフィルタしたブログ検索とかあると素敵かもしれないですね。
ブログ全体を対象にしたら無理っぽいですがニッチなテーマに絞ったブログ検索とかなら目はありそう。

会員機能

会員機能とかつけても閑古鳥が鳴くだけだぜ!ということは重々承知の上で独自コンテンツが欲しかったので作りました。
基本的に会員がうれしくなるような作りになってます。

  • ユーザーレビュー(自分の思いの丈をぶちまけられてうれしい)
  • 値下げ通知(お目当てのアイテムが寝下がったらすぐ分かってうれしい)
  • 所持品管理(自分の持っている物がなんなのかわかって二度買いとか防止できるのでうれしい)

ね、うれしいでしょう?
今後の盛り上がりに期待したいところです。俺たちの戦いはこれからだ!

今目指しているところ

最初は価格比較のみで行こうと思って始めたサイトですが、最近「アウトドア用品のデータベースっぽくできるんじゃないだろうか?」とか言う考えがふつふつと。
まあ趣味で好きな分野なので長く続けることも苦ではないということでコツコツやっていこうと思ってます。