« PHPSESSIDへの対応を修正 | メイン | 11/27(Sat) 深夜にシステムを更新します »
2004年11月23日
クローリングの仕組みを変更します【重要】
MyRSS.jp - 重要なシステム変更を実施します。
※RSSに表記されるニュースタイトルが短くなる、というお知らせです※
※みなさんの方では特に作業等必要ありませんので(その点は)ご安心ください※
MyRSS.jp では、より正確な「ニュース」取得のため、クリックできるテキストをニュースとして取得した上で、
・実際にリンクをクリックして、最終的に辿り着いたページのタイトル
もニュースの一部に含めていました。すなわち
<クリックできるテキスト> ( <リンク先ページのタイトル> )
をニュースヘッドラインとして扱っていました。
しかしながら、
・システム負荷が重い
上に
・「リンク先ページのタイトル」はどうやったら消えるんですか、という問い合わせも多い
⇒「RSSのカスタマイズ」により対応可能にはしているのですが・・・そもそも邪魔 ^^;
など、メリットが薄いと判断し、この機能を削除することにしました。
一週間ほどの周知期間を経て、来週には「リンク先タイトルを取得しない」ようにシステムの更新を行います。
この時点から、RSSのカスタマイズ設定を行っていない方の RSS フィードには、
( リンク先タイトル )
が出力されなくなります。
カスタマイズ設定されている方も、新規に追加されたニュースに関しては、リンク先タイトルが「無い」状態になります。
これにより、デメリットとして考えられるのは
・TECHSIDEなどのサイトのニュースがとても読みにくくなります。
⇒特殊対応等を検討しましたが、ルールが複雑になりますので断念しました。
⇒というか過度の個別サイトへの対応は著作権上問題があります・・・ ^^;
・広告リンクを毎回拾う可能性があがります。
⇒最終的に同じページに飛ぶリンクも、HTML上のURLが異なると「違う」リンクとして取り扱います。広告など動的URL生成に弱くなります。
とはいえ、そんなことより「登録可能なサイトの上限を増やして!!」というのが多くの方(上限一杯の方・・・調べたら何百人もいらっしゃいますね・・・すいません...)のご意見かと思いますので、ここはシステムをシンプル&軽くすることにご賛同いただければと思います。
#登録サイトの上限拡大は、システム負荷の状態を見ながら来年のクーポン配布時点で検討したいと思います。
ということで、本変更により、RSSの出力内容(ヘッドラインテキスト)が変更となります。ご注意ください。
投稿者 aka : 2004年11月23日 03:25 / 2004年11月 / (~2006) My RSS について
トラックバック
このエントリーのトラックバックURL:
http://133.242.136.64/mt-tb-sf.cgi/132
このリストは、次のエントリーを参照しています: クローリングの仕組みを変更します【重要】:
» 3月11日(土)OpenPNE ソーシャルネットワーキング入門セミナー from SNS ソーシャルネットワーキングコミュニティー
OpenPNE ソーシャルネットワーキング入門セミナー日程: 2006年03月11日(土) 受付: 18時00分〜時間: 18時30分 〜 21時00分 会場:... [続きを読む]
トラックバック時刻: 2006年03月02日 21:24
コメント
>「リンク先ページのタイトル」はどうやったら消えるんですか、という問い合わせも多い⇒「RSSのカスタマイズ」
ってあるのですが、カスタマイズはどうやってやるのでしょうか?
リーダーとかスクリプトのほう弄るということでしょうか?
投稿者 質問 : 日時 2004年11月26日 18:29
コメントありがとうございます!
カスタマイズは、クーポンを登録すると現れます。
⇒ http://blog.myrss.jp/archives/000102.html
MyRSS.jp では、RSS のカスタマイズ(表示の変更とフィルタの設定)が行える機能を実験的に提供しています。
よろしければお試しください。
投稿者 Gombei : 日時 2004年11月27日 01:37
さっそく試しました。いろいろ設定できるんですね。ありがとうございました。
投稿者 質問 : 日時 2004年11月27日 13:24
うーん、なるほど。そうですね。
抽出ルールについては、もうすこしいろいろと検討してみることにします。
投稿者 Gombei : 日時 2004年11月29日 23:09