(このメモは「初心者向け」のコンテンツそれ自体が悪いとか、初心者がうざいという意味ではなく、 入門的な記事にはトラフィックが集まりやすいということから、 どういう問題が起きてくるか、といったことを書いたものです。内容がいまひとつハッキリしないので、後からきちんと整理し直したいです。)
「妖精現実 フェアリアル」つまり、今ごらんのこのサイトの最近1年間のトラフィックは、 平均して、1日あたり1GB強、1万2000人、2万5000ページビュー、20万ヒット程度で推移しているようだ。 これはテキストサイトとしての統計で、ソフトウェアの配布は含んでいない。 ソフトウェアの配布は1ファイルが数MBと大きく、帯域的に負担になるが、ここではその問題は考えない。
テキスト中心のサイトで、1日1GB程度というのは、少ない量ではないが、人気サイトというほどの量でもなく、 中間的な値だろう。これは内容が一般向けでないためと考えられる。 長期的に見て、トラフィックはほぼ一定しているようで、目立った増加傾向・減少傾向はない。 このサイトの「本来の」読者は、おおむね既にこのサイトを発見しているか、 あるいは読むのをやめる読者数と新たに読み始める読者数がだいたい拮抗しているためと思われる。
「妖精現実」のトラフィックのパターンは、 典型的なサイトと少し違う性質があるようだ。
以上のことから、次のような問題が生じる。
当然ながら、情報が最新でなかったり、現在の立場から見て総合的でないという結果を招く。
「マニアの矛盾」でも説明されているが、 あまり知られていない新技術などを紹介したものの、その後、記事を更新してないことが多い。 例えば数年前、デジタル字幕についての一連のチュートリアルを公開した。 最初に動画作成の手順を説明する部分では、XviDのベータ版を使っている。 当時はそれが最新だったのだが、現在(AVCなどのことは別にしても)高速で高性能の XviD 1.0.x が出て 1.1 が一般になっている状況で、 この古い記事にそのまま従うのは、問題がある。間違いが起きるわけではないが、 エンコードの速度面で時間が無駄になるだろう。
ところが、XviD の設定など調べればすぐ分かることだと思って、放置している。 入門的記事を増やすと、トラフィックやサーバ負荷の面での負担もある。 当時としては、 DivX をやめて XviD に乗り換えようというのは、XviD が少数派だったのでマニアックな意味合いがあったのだが、 今となっては DivX が XviD より良いと思っているほうが少数派で、その二つの間では XviD の方が標準なので、 今さら書くこともない。 そのため、デジタル字幕の技法などの先端的なことを紹介している一方において、 もっと基本的なコーデックの説明がだらしない状態のままになっている。「マニアの矛盾」そのものだ。
さらに、そのときたまたま(少数のマニアックな読者が読むことを念頭に)実験的にやったことが、 後から一般化して、ニュアンスが変わってくることがある。 例えば、OGMの再生法については、OGMが無名に近かった時期に「作っても再生が面倒だし」というネガティブな見方に対応するために、 つまりOGMという当時極めてマイナーだった技術を広めるために書いたものだが、 OGMがエロ動画などで普及してしまい、今では「エロ動画を落としたはいいが再生法が分からない」というリーチャーに利用されているありさまだ。 少数のマニアが「OGMでソフトサブをやろう」「日本語の文字化けを回避するには」「うまく機能するチャプターの打ち方」などを検討していた当時の記事群が、 今では全然別の文脈で利用されている。
AAC音声の動画や、RMVBなども「GraphEditを使ったらこんなことができた」「RMVBをDS経由で再生できる」などの実験的なおもしろさで、 気まぐれに書いたことでありながら、やや普及度が上がると「AAC音声を推奨している、RV10を推奨している」などと誤解されたりする。 要するに、どのガイドも、 他の情報も参考にしながら積極的に応用するのでなく、書いてある手順を1ステップずつそのままやるような読者層に行き渡ると、 問題が起きてくる。最初のデジタル字幕の話も、DVDの音声をAC3のまま使っているが「音声はどのフォーマットでも入れられるから、 とりあえずここでは面倒だからAC3をそのまま入れておく」というだけの話なのに、AC3音声を推奨していると誤解されたりする。TTAとWVは総合的には互角なのに、たまたまTTAだけ取り上げたせいで、他の雑誌なども「今注目されているのがTTAだ」などと劣化コピーの伝達を行う。
「「無断コピー以外」を禁止するライセンス」でも詳しく説明されているが、 従来型(マスメディア)の情報産業では、情報が売れれば売れるほど(利用されればされるほど)情報発信側が経済的に儲かるようになっていた。 インターネットの時代の、ミクロ(個人や小グループ)を単位とする情報のトポロジーでは、 情報が利用されればされるほど発信者が損をするという逆の状況が生じやすい。 有用な情報を発信しようとすればするほどブレーキがかかり、 無用のくず情報を発信することがシステム的に推奨されるのでは、究極的には、全体のクオリティの低下につながり、 好ましくない。 ミクロを基盤とする情報ネットワークが本質的に矛盾しているというわけではなく、 ウェブを脱中心的(分散的)にするP2P技術や、 「「コピーさせないこと」に課金するのが合理的な理由: 「コピーに課金」でなく」で説明されているような逆向きのコスト負担の考え方によって、発展的に解決されるべき問題だろう。
現在、「妖精現実」では複数のサーバを「RAID的」に利用している。 「RAID的」という意味は、個々のサーバは専用サーバのようにしっかりしたものでないが、 安いサーバに情報を冗長にミラーしておけば全体としてコストパフォーマンスと信頼性の両方が最適化できるだろう、ということだ。
ごく一部の例外を除き faireal.net 上の全リソースは fairyland.to にそのままミラーされている。 トラフィックの分散は、当初ほぼ50%ずつだったが、現在は80%と20%程度で運用されている。 実はミラーの fairyland.to の方が日本からは高速なのだが、 faireal.net のサーバとは個別交渉で特別な契約を結び、faireal.net の負荷が高くなった場合は、 他のアカウントを遅くしても faireal.net に優先してリソースを割り当てるようになっている。 実質的に、共用サーバと専用サーバの中間的な扱いとも言える。 通常の共用サーバでは1アカウントで1%のリソースを占有した程度で警告されるが、 faireal.net ではその問題は起きない。 専用サーバが必要なほど極端にトラフィックがあるわけではなく、トラフィック的には中間的なので、この方法でとりあえず良いと思われるが、 もちろん「他のアカウントに影響するほどリソースを占有する権利」は無料で得られるわけでなく、 「情報が売れれば売れるほどどんどん損をする」という法則の呪縛からは逃れられていない。
トラフィックを減らす方法としては、テキストサイトではZLIB圧縮も有効だ。 これはPHPでサポートされていれば.htaccessに1~2行書き加えるだけで、体感的にページの表示も相当速くなる。 次に、サーバ負荷を減らす方法としては、もちろんページをなるべくスタティックにすることがあるが、 大量のページがある場合、完全にスタティックなページでは保守性が悪すぎる (フッタを1行変えるために数百のHTMLを更新するなど考えたくもない)。 保守性とサーバ負荷はある程度、トレードオフの関係にある。 ただし、XHTMLのMIMEタイプをどうするかとなると、純粋主義者からすれば「MSIEのご機嫌を取るためにレスポンスヘッダを動的に生成する」わけだが、 実用主義者からすれば「全部text/htmlでいいではないか」とも言える。 これは保守性についてのトレードオフではなく、進歩的な立場と後方互換を重視する立場の対立であり、 レスポンスヘッダを動的に書き換えることは二つの立場を両立させるが、その代償として、多少サーバ負荷が上がる。 Mozilla系でのルビのサポートをCSSでハッキングする場合も同じことが言える。これらについては、いろいろな考え方・立場があって、 どうするのが最善かという決定的な答えがあるわけではない。
コストの負担が難しくなった場合には、作成側の保守性、利用側の利便性を犠牲にしてでも、ページをよりスタティックにしたり、 初心者向けの記事をあえて減らすことも必要になるかもしれない。 「妖精現実」がサーバ負荷の高い作りをしても、何とかもっているのは、 それなりのコストを支払っているからというのもあるが、 内容があまり一般向けでない(つまり利用者がそれほど多くない)という大前提で成り立っている部分も大きい。 その意味でも、マニアックだったはずの内容が意外に普及してきて多くの人に情報を利用されるようになると、 そのこと自体は(利害得失を度外視すれば)喜ぶべきことなのだろうが、 コスト面で計算違いが生じてくる。
一般向けのエンターテインメント的なことが得意なわけではないが、 まったく書けないわけでもない。 また、マニアックな技術について紹介するからには、その基礎となる入門的な部分は書けば書けるわけだ。 しかし、そうしたことは、モチベーションもさることながら、純粋にサーバのリソースによっても制限されてしまう。 コストはこっち持ちなのだから、あまり人気が出すぎては困るわけで、 帯域オーバーに対する多額の追加料金を請求される状況は避けなければならない。 さらに、多くの人にそこそこ役立つような広く薄い情報を無難に提供するというのは従来型のマスメディアの役割で、 インターネットは、少数の読者圏を前提とする多数のディープでマニアックなサイトの結合であるべきだ、という思想的立場も働いている。 いたずらな難解や晦渋、独りよがりを肯定するものではないが、 あまりに一般向けを意識して誰でも分かるように親切ていねいに書くより、 ある程度「これが役立つ人が役立ててくれればいい」という割り切りで、狭い範囲にディープに切り込んだ方が、 ウェブ全体として良い結果になるはずだ。具体的に、例えば「日本語の字幕を縦書きにする方法」を詳述したところで、 その情報が役立つという読者はごく少数だろうが、だからといって、 もっと一般的な「DivXのインストール方法」を1ステップずつ画像入りで解説したサイトばかりになったら、 ネットの意味がないではないか。
「もういつ終了するか分からない」「長くは続けられない」「リンクするのでなく必要なら全文コピーしてほしい」といったことは、 哲学や宗教ではなく、単純にサーバ負荷が高くなると、お金が払えなくなって続けられなくなる、 ということなのだ。もっと露骨に言えば「無断コピーしてもらった方が、わたしは儲かる」(コストを削減できる)。 ひるがえって、リンク等は勝手にしてくださいと明記してあるのに、 リンクというこちらの帯域を食う行為をするうえに「リンクしていいですか。お返事ください」 などとメールをよこして管理者らの時間を浪費させるのは、絶対に避けるべき行為だ。
一般論として(このサイトについての話でなく一般に)おもしろいコンテンツ、 役立つコンテンツを作成できる能力がある人、才能がある人がその情報についてのコストを負担して、 情報を利用する側のリーチャーはコストを負担しない、というのは不自然だ。 ところで、この場合のコストというのは、何もリーチャーが発信者に金を払うべきだという意味ではなく、 単にサーバ負荷(CPU)と帯域のコストのことなので、要は分散系に移行できればいい。 利用者自身が利用するリソースについていくらかのCPUリソースを負担し、BTのように「サーバント」となれば、 お金の移動は必要ない。「帯域が必要なんですね。わたしの帯域を分けてあげますよ」という現物払い、みたいなものだ。このようなトポロジーが成り立つためには、 キャッシュ(古い言葉で言えば無断コピー)は場合によってはフリーの情報発信者に利益を与える面もある、という点が、もっときちんと認識されるべきだろう。 商業ベースで情報を販売するならもちろん話は別だが、 個人サイト等で、フリーで普通に発信したいのに、 プロプライエタリのマスメディアの感覚と混同して「自分の文章が無断で利用されるのは、わたしにとって損害だ」と錯覚してしまうと、 いつまでたっても、非生産的なリーチャーのために生産的な発信者がコストを負担する構造から抜けられない。
ただしこれは心理的な面やスケールの要素もある問題で、 「情報の作者として尊敬されたい」というモチベーションが「情報自体」を生かしたい気持ちを上回ると機能しない。 図式的には「わたしが死んだらこの情報は利用できなくなります」という作者と作品の無理心中関係だ。 なぜならその作者にとって作品は第一義的に自分の功名心を満たすためのものだから、 そのこと自体は少しも悪くないが、結果としては、本人が死んでしまえば、 その作者にとっての作品の第一義的な存在意義もなくなるわけだ。
スケールについては、トラフィックが1日100MB程度までなら、キャッシュしてもらうメリットは必ずしも明確でないから、 無断転載されると更新の同期などの点で不都合がある、といった問題の方が大きいかもしれない。 よって、上記に述べたことがすべてのサイトに当てはまるわけではない。
しかし1日のトラフィックが1GB~数GBのスケールは一つの臨界点と考えられ、 10GB/日のオーダーとなると、資産家などでない一般の者が広告なども入れずに完全にフリーで運営することはやや困難になるだろう。 ポイントは、この困難性は本質的に不可避な構造ではなく、単に分散ウェブが実現すれば技術によって解消できる、ということだ。 ウェブ全体で見れば帯域は余っているし、世界中のCPUをトータルすればこれまたアイドル時間ばかりだから、 それを利用することは資源の有効活用だろう。
既に指摘したように、そのような新しい方式に移行しないと、長期的にはウェブ上にはくず情報が増え、 従来、外国から専門書を取り寄せても分からなかったような貴重な情報がフリーで利用できる、というインターネットの本来のメリットが薄れてしまう危険がある。 高品質の(被参照量の多い)情報を発信すればするほど損をするなら、それら発信者のかなりの部分は発信をやめてしまい、 究極的には被参照量がゼロに近い(つまり何の役にも立たない)情報ばかりになってしまう。 実際には、情報がフリー(無料という意味ではなく、フリーダムという意味でのフリー)であることに価値を見いだす発信者は、 自腹を切ってでも情報をフリーに保とうとする。 実際、そういう者は自分のサーバ費用を払うのはもちろん、無料のリソース(GPLソフトやフォーラム)に対してかなり頻繁に寄付をしたりもするだろう。 極論すれば「シェアウェアはただで使うが、フリーウェアには金を払う」ということ、 つまり「奴隷虐待には一切協力しませんが、創造の自由と作品の幸福のためには微力ながら貢献したい」ということであり、 そこには「早くお金のない平和な世界になりますように」という哲学あるいは理想主義がある。 「売られるために育てられ管理される作品より、自由に生きる作品の方が幸せだ」と。
それはそれで尊い行為・尊い哲学ではあろうけれど、もう少し現実的なレベルで考えて、 インターネットの空きリソースを有効活用すれば、 フリー(自由)をフリー(無料)で実現する、という理想的な状態にかなり近づける可能性がある。
「自由」というと、それだけで「良いこと」のような連想が働きやすいが、 ここでは自由の良さを訴えているのでも、どちらが良いか判定しているのでもない。 単に、関連するかもしれないいくつかのポイントについてメモした不完全なリストだ。
実際の作品は、きっちり二分できる(どっちかの一方と断定できる)わけではないが、 ちょっと考えてみるための抽象的モデル。他にも何かあるかな…?
あくまでポイントを整理するための便宜的な分類で、価値判断ではないことに注意。