つくたろうのブログ

ポケモン色違い厳選や国立大学巡りが好きな大学生、つくたろうの気ままな雑記帳です。当サイトは広告を含みます。

【地味にうざい】まとめポータルに記事がない理由と対処法【解析】

【地味にうざい】まとめポータルに記事がない理由と対処法【解析】

www.tsukutarou.net

www.tsukutarou.net

こんにちは、つくたろうです。

はてなブログを愛してやまないつくたろうですが、今回「ライブドアブログ」を解析する機会があったので、それについての記事を書いていきたいと思います。

扱う題材は、ライブドアブログの「まとめポータル」についてです。

はじめに

この記事を読んでくれているということはおそらく、ライブドアブログの記事を読んでいて、記事本文末尾の「まとめポータル」に気になるタイトル/サムネイルの記事を発見し、そしてクリックした結果飛ばされたアンテナサイトのどこにも当該記事が発見できなかった…という状況に直面されたことと思います。(あなたがそうでなくても、私がそうでした(笑))

これは結構イラっと来る現象ですよね。特に私はライブドアブログで盛んなジャンルの一つである「2ちゃん(5ちゃん)まとめ」を読むのが大好きで、まとめポータルに面白そうなスレタイを見つけたら絶対に訪問するぐらいには「まとめポータル」のお世話になっています。

www.tsukutarou.net

しかし、この「まとめポータル」から飛んだ先のアンテナサイトに、その記事へのリンクが見つからないというケースがしばしば発生します。これは地味~にうざい。

別に無いなら無いでそれまでなんですが、検索しても意外と共感の声や対策について述べている記事が見つからなかったのと、実際にサイトを解析して「なるほど、そらこの問題起こるわな」と納得したのもあり、こうして記事を書いている次第です。

ちなみに、そもそもアンテナサイトに一度飛ばされる…ということについての是非はここでは議論しないことにします。別に僕は面白いスレに巡り合える確率を上げるという意味ではアンテナサイト嫌いじゃないんですが、快く思っていない人が一定数いるのも事実です。このことについてはまた記事にしたいなと思っています。

そもそもまとめポータルとは

一応「まとめポータル」とは何かについて、触れておきましょう。分かりきっている方は飛ばしてもらって大丈夫です。

ブログにありがちな「そもそも○○とは?」の章については賛否ある(多分否の方が多い)のですが、その記事に検索で来る方が100%ではない以上設ける意義はあると思っています。

検索で来られた方は扱う対象について「分かりきっている」上で記事を開きますが、それ以外の来訪者は「それが何か知らない方」である可能性があるのです。知らない方が読みに来得る以上は、やはり対象についての説明を挟む必要があるというのが私の考えです。

閑話休題。ライブドアブログの「まとめポータル」の話に戻りましょう。

ライブドアブログの「まとめポータル」とは、ライブドアブログ内で特に注目されているブログ記事や話題のコンテンツを集約して紹介するページ、そしてそのページから関連性の高い記事を抜粋して表示するセクションのことです。

「まとめポータル」として独立したページがあり、さらに、記事末尾に数記事へのリンクが載っているセクションについても「まとめポータル」と通称されているという点に注意が必要です。

この「まとめポータル」は、読者が興味のあるトピックや流行の話題を簡単に見つけることができるようなサイト/セクションであり、多様なカテゴリーにわたる記事がまとめられています。ライブドアブログのユーザーが作成したコンテンツがピックアップされ、読者が新しいブログ/ブロガーや興味深い記事に出会うきっかけを提供しています。

また、ランキングや新着記事、おすすめ連載など、さまざまな形式でコンテンツが紹介されているので、様々な記事と出会うことができるという点でも魅力的だと思います。

まあこれは別にまとめポータルの特徴というよりは、アンテナサイトという形態のサイトの特徴なのです。唯一「まとめポータル」にユニークな特徴としては、これがライブドアブログによって運営されており、ピックアップの対象がライブドアブログのみである点でしょうか。

www.tsukutarou.net

「まとめポータル」に記事がない理由

さて、このまとめポータル、しばしば「記事末尾のまとめポータルセクションに掲載されているリンクをクリックしても、遷移したまとめポータルページには該当する記事が見つからない」という問題が発生します。

普通だったら赤字でその記事へのリンクが強調されたものが表示されるのですが、これが表示されないパターンが多い。リンクを踏んでいたはずなのに踏んでいたのは無駄足だったのです。これが結構うざい。

この問題が発生する理由は、リンク切れとかそういう単純なものではありません。

もちろん記事の削除等で本当にリンク切れが発生していることも考えられますが、一番の原因は「ポータルのシステムそのもの」にあります。

まとめポータルのシステム

実はまとめポータルのサイト(飛ばされる方)って、どんな「まとめポータル」のセクションのリンクから飛んでも、根本は同じものが表示されるようになっています。

というのも、そもそもあのリンクは、「まとめポータル」という、常時更新され続けているサイトに飛ばしているだけなのです。そしてこの常時更新は、基本的に「新着の記事をピックアップしている」だけ。もちろん内部でランキングなどの処理は行われているとは思いますが、それはライブドアの中の人のみぞ知ることなのと、本題とは関係ないので今は触れません。

とりあえず何が言いたいかというと、あれは別に飛ぶために踏んだリンクなどに合わせて生成しているサイトに飛ばしているのではなく、リンクとは全く関係のない「その時点での最新ピックアップの一覧」に飛ばしているのです。

ここまで書けば、「なぜ当該記事がないのか」という理由についてもだんだん見えてきます。そう、セクションで踏んだリンクの記事が時間の経過などによって「最新のピックアップ」から外れていたら、もう飛んだ先には「記事がない」ということが発生してしまうのです。

ライブドアの「まとめポータル」は、かなりの高頻度で更新され続けています。最新記事のピックアップも、秒単位で更新されていきます。

そのため、ほとんどの記事は「まとめポータル」に載っているのは長くても数時間程度です。その「数時間」が終わってしまったら、もうピックアップから外れるため、「記事がない」ことになるのです。

www.tsukutarou.net

なぜ時間切れでリンクも更新されないのか

さて、時間の経過とともにサイト側でのピックアップから外れることによって「記事がない問題」が起こりえるということについて説明してきました。

では、そもそもなぜ、各記事の末尾のセクションに「時間切れ」になるようなリンクが置かれているのでしょうか。

これもライブドアブログのシステムというか、仕様上の問題なのです。

ライブドアブログの各記事は、(URLを見ればわかりますが、)静的なhtmlファイルで提供されています。つまりライブドアブログでは、WordPressのように直接データベースから記事を描画するのではなく、一度記事のページをhtmlとして生成してから、それを表示しているのです。

この生成は、基本的にはアクセスするたびに発生します(ページを再読み込みしてみれば分かります)。そういう点ではWordPressとやっていることは似ているのですが、配信形態が静的なhtmlファイルであることが、問題を引き起こしているのです。

引き起こされている問題は、大きく3つ。

一つ目は、「リンクの生成に古い情報が使われうること」です。

既に最新ピックアップから外れている記事もリンクバナーの生成に使われてしまうために、飛んでも「記事がない」状態が引き起こされてしまうのです。

二つ目は、「記事を読んでいる時間のタイムラグ」です。

リンクバナーが生成されるのは記事を開いた時なので、実際に記事末尾まで読み終えてそのバナーをクリックするまでには時間差があるのです。

そのため、「記事を読んでいる間に最新ピックアップから外れてしまう」ということが起こり得るのです。

三つ目は、キャッシュです。

そう、この「記事のhtmlファイル」、そのままキャッシュに残ってしまうんですよ。

キャッシュに残ってしまうということは即ち、「最新版以外の記事ファイルにアクセスしうる」こと。

アクセスした情報が必ずしも最新のものではないために、最新のピックアップから外れたリンクを踏んでしまう可能性があるということですね。

キャッシュ等の詳細な仕組みについてはこれ以上は述べませんが、興味がある方はCDN関連の書籍なんかを当たるのが良いと思います。

最近5ちゃんを閲覧しているとよく出くわす「Cloudflare」なんかもCDNですし、そういった方面からもCDNなどについて勉強しておく価値はあると思います。(まだまだ概念として浸透しておらず、誤解している方も多く見受けられますし、、、)

本当にリンクとは関係ないのか?

さて、上の節を読んで、「本当にあのリンクはどのボタンを踏んでも全く同じ『まとめポータル』サイトに飛ばしているだけなのか?」という疑問が湧いてくる方もいらっしゃると思います。

厳密には、リンクボタンはそれぞれボタンごとにクエリパラメータ(どのブログから来たか、などの情報)を持っていて、そのパラメータに合わせたサイトが表示されるようにはなっています。

じゃあ言っていることが違うじゃないかって?いいえ、「最新ピックアップを並べた同じサイトに飛ばしている」という点については違わないのです。

この「パラメータに合わせたサイト表示」が何をやっているかというと、「最新ピックアップのうち上位の数記事についての表示を、飛んできたボタンの持つパラメータによって制御している」だけです。もちろん制御と言っても表示されるのは「最新ピックアップに含まれる記事」のみ。要するに、「リンクに書かれていた記事を載せるような制御などは全く行われていない」のです。

最新ピックアップの中から「飛んできたブログに関連しそうなカテゴリ」を上に持ってくるだけ。それが、「パラメータを用いた、ある程度の制御」なのです。

赤字での強調の仕組みと、されない理由

サイト末尾のセクションにあるまとめポータルのリンクを踏んでアンテナサイトである「まとめポータル」に訪れると、該当する記事へのリンクが赤字で強調されており、その記事に行ける場合があります。

場合がありますというか、本来期待されているのはその挙動でしょうね。

しかし、この記事で扱っている問題の通り、そうでない場合の方が圧倒的に多い。

これも、ライブドアブログの赤字強調システムの仕組みに問題があるのです。

というのも、アンテナサイトなどを使っている感覚だと「リンクバナーと赤文字強調は一対一に対応している」と考えがちなのですが、実は「まとめポータル」の赤字強調の仕組みは、そうではないのです。

「まとめポータル」のリンクには、実は「どの記事を赤字にしたいか」という情報しか含まれていないんです。そしてこの「赤字にしたい記事」と一致する記事が「最新ピックアップ」の中に含まれていた時のみ、赤字の強調が発生するのです。(要するに、「○○な件について」みたいな記事についてのリンクバナーは、「『○○な件について』という記事へのリンクを赤字にしたい」という情報を含んでいるだけに過ぎないのです。)

先ほどから述べている通り、まとめポータルセクションのリンクバナーは「どんなリンクから飛んでも、その先は同じ『まとめポータル』のサイトに飛ぶだけのリンク」なんです。リンクによって飛んだ先の最新ピックアップからその記事が脱落していれば、当然「記事がない」状態になりますし、記事がないので当然赤字の強調も発生しないのです。

まとめポータルに記事がないときの対処法

さて、ここまで「まとめポータルに記事がない問題」について、ライブドアブログを解析した結果から判明した理由を述べてきました。

かなり詳細に書いたので、おそらく問題が発生するメカニズムについては理解していただけたことかと思います。

メカニズムが分かったということは、そのメカニズムから導かれる対処法も分かりますよね。

そもそも「まとめポータル」の仕様上、バナーから飛んだ先に目的の記事のリンクがないことの方が多いわけですから、「まとめポータル」に飛ぶことがもう無駄足なわけです。

そうなるともう、最も効率よく目的の記事にたどり着く方法は、「記事タイトルでググる」ことです。

ググればだいたい一番上に出てきます。絶対とは言いませんが、99%出てきます。

もし出てこなければ、今度はサイト名で検索しましょう。そうすればそのサイトにたどり着けるので、あとは目的の記事を開くだけです。

そのまんま過ぎて、もう対処法と言っていいのかすらよくわかりませんが、間違いなく目的の記事にたどり着ける方法です。

アドレスバーを使って検索すれば、手間的にも「まとめポータル」に飛ぶよりも少なく抑えられますし。

www.tsukutarou.net

おわりに

さて、この記事では「まとめポータルに記事がない問題」について述べてきました。

はてなブログを愛用している僕ですが、たまにこうして他のブログサービスを解析してみるのも楽しいですね。

ちなみにライブドアブログを解析したといっても、違法性のあるような方法は一切取っていないので、そこのところは安心してください。普通にWebブラウザからアクセスできる範囲でライブドアブログのサイトを訪問して、複数のURLなどを比較してパラメータを解析しただけです。(すべて手動でやりました。)

自分はWebエンジニアでもあるので、こういう「既存のサービスがどういうアルゴリズムを採用しているか」を見ることは非常に有意義な勉強になります。(もちろん書籍などで体系的に学んだ知識がベースにある前提ではありますが、、、)

またこれからも、こういう機会があればいろいろ解析してみたいですね。またその時は記事にしたいと思います。

とりあえずこの記事はこの辺で。ここまで読んでくれて、ありがとうございました!

2023/11/08 つくたろう

カテゴリ:


大学生ランキング

www.tsukutarou.net

www.tsukutarou.net

www.tsukutarou.net

www.tsukutarou.net

www.tsukutarou.net

www.tsukutarou.net