2経路によるプロクシキャッシングサーバのアクセス統計

データの収集

 

車古 正樹

 

920-1192 金沢大学総合情報処理センター

金沢市角間町

TEL076-234-6912

shako@office0.ipc.kanazawa-u.ac.jp

 

 

概要

 

 インターネットを有効利用するために、北陸地区としてのマルチメディア情報発信の実験プロジェクト(MPRO)がある。このプロジェクトが実験用として、学内に1.5MbpsOCN(Open Computer Network)回線をレンタルし、学内LANと接続した。この回線とSINET(Science Information Network)回線の2経路からプロクシキャッシングサーバでアクセス統計データを収集したので、その結果を報告する。この報告データが外部の回線と接続する場合の参考資料となることを期待する。

 

 

キーワード

 

 OCN、アクセス統計データ、プロクシキャッシングサーバ

 

 

 

 

 

 

 

 

 

 

Collection of Access Statistics Data of Proxy Caching Servers by Two Routes

 

Masaki Shako

 

General Information Processing Center, Kanazawa University

Kakuma, Kanazawa, Ishikawa (Zip.920), Japan

TEL076-234-6912

shako@office0.ipc.kanazawa-u.ac.jp

 

 

Abstract

 

There is an experimental project team(MPRO) of the Hokuriku district for sending the multimedia information to use the internet effectively. This project team rented the OCN line of 1.5Mbps for the experiment, and connected it with the LAN of the university precincts. The access statistics data have been collected from two routes of the OCN(Open Computer Network) one and the SINET(Science Information Network) line through proxy caching servers. The presented data are expected to contribute to the network managers in the case of connecting the LAN with the external line.

 

 

Key words

 

 OCN(Open Computer Network), access statistics data, proxy caching server

 

 

1.はじめに

 

 最近のインターネット利用の急激な技術の発展と利用の増加に伴い、LANSINETおよびSINETと他のネットワークのトラフィックが繁茂時には飽和状態にあり、情報の取得におけるレスポンスタイムが悪くなるばかりである。これを解決するには、SINET回線の高速化と充実を待つか、あるいは自学で民間の回線と接続するか、のいずれかである。ところが、前者は学術情報センターの範疇にあり、敏速に対処するためには後者を選択せざるを得ない。しかしながら、後者の民間回線との接続にはかなりの予算が伴うため、接続にあたっては十分な検討を要することになる。幸いなことに、当大学において、マルチメディア情報発信の実験のため、共同研究費で当初3ヶ月間は1.5Mbpsで、その後は128KbpsOCN回線をレンタルすることになり、この回線を利用してSINETOCN2経路からプロクシキャッシングサーバを通して情報の取得を行った。このアクセス統計データを本稿で報告するが、このデータが、民間回線との接続する場合の参考資料となることが期待される。

 

 

2.アクセス統計データの収集方法

 

 

2.1 構成方法

 

 アクセス統計データを収集するための構成方法をFig.1に示した。2経路からのデータの収集は、OCN回線とSINET回線にプロクシキャッシングサーバを親として設置し、その下にプロクシキャッシングサーバを子として設置した。端末は子のサーバにのみ接続することにより、データ収集を行った。なお、子のサーバは3台設置し、子のサーバ同士は兄弟関係(sibling)の設定を行った。利用者端末は現在約200台程度である。なお、SINET回線用プロクシキャッシングサーバと3台の子のサーバは同一セグメントであり、これら以外の計算機が接続されていないセグメントである。この1セグメントのみで1サブネットを構成している。

 端末からの要求を受けた子のSquidプロクシキャッシングサーバは、親のOCN回線用サーバと、親のSINET用サーバにほぼ同時に「接続要求を行い、その確認応答の戻る時間」すなわち、RTT(Round Trip Time)の短い親サーバからデータを取得するために、 Fig.1のような構成方法を採用した。

 

 

2.2 システム構成

 

 データを収集解析するために、5個のサーバに以下のソフトウェアを使用した。

 ・OS : System V Rel.4

 ・プロクシキャッシングサーバソフト Squid-1.1.20

 ・データ解析ソフト calamaris V2squid-stats v1.4.

 ただし、ここではcalamarisのみのデータを利用した。

 

 

2.3 ネットワーク環境

 

 OCN回線用プロクシーキャッシングサーバに関しては、実験を始めた417日から71日までは、OCN回線の速度は1.5Mbpsであり、その後は128Kbpsである。OCN回線は実験用であり、ほとんどの時間がこのサーバのトラフィックのみである。OCN回線用サーバと子のサーバ間は別セグメントであるが、トラフィック容量は十分確保されている。

 SINET回線用プロクシーキャッシングサーバに関しては、SINET回線の速度は4Mbpsである。SINET回線は北陸地区のノードであり、昼間は100%近い負荷があり、実験に利用できるトラフィックが変動するものとおもわれる。SINET回線用サーバと子のサーバ間は同一セグメントであり、トラフィック容量は十分確保されている。なお、このサーバは北陸地区のSINET加入校に公開されており、データ収集用の子のサーバを含め、子のサーバが11台と兄弟のサーバ5台が接続されている。このため、サーバのキャッシュに対するヒット率は高いが、サーバの負荷やネットワークの負荷もOCN回線用サーバに比べて高くなる。しかし、実験結果からデータの収集において、ネットワーク負荷による影響がないと判断できた。

 

 

2.4 収集データについて

 

 アクセスデータ統計は3台の子のサーバのアクセスプログラム(calamaris)のレポート(Squid-Report)を集計したものである。収集したアクセスデータのうち、外部回線の利用状況に関係するデータについてのみ報告する。利用したレポートは子が親に要求した統計データ(Outgoing requests by destination)である。このデータのうち、子の要求に対してヒットしなかったデータを親が外部回線から取得(FIRST_PARENT_MISS)したデータの件数と容量および転送速度について集計した。なお、OCN回線とSINET回線から取得したデータの件数および容量の割合に変化が少ない420日以降、約1ヶ月間のデータは省略した。

 

 

3.データの集計と考察

 

 

3.1 取得データ量の比較

 

 Table 1は、2経路からの取得したデータの件数と容量を1週間単位(月曜日〜日曜日)にまとめて集計し、2経路の内のSINET回線が占める百分率を求めて表記した。Fig.2は百分率をグラフにしたものである。この表や図から明らかなように、SINET回線からの取得したデータの容量(受信量)の百分率が95.1%から24.4%に減少し、OCN回線からの受信量の割合が急激に伸びていることが分かる。なお、72日から回線速度が約10分の1の128Kbpsとなったが、その影響はほとんどみられない。現在の利用状況であればTable 2の転送速度から判断して数件の取得データが重ならない限り、影響が無いと推測できる。

 

 

3.2 転送速度の比較

 

 Table 22経路からの取得したデータの件数と転送速度を1週間の平均値にまとめて集計し、SINET回線とOCN回線の転送速度(kB/sec)の差を求めて表記した。Squidプロクシーキャッシングサーバでは複数の親サーバと接続されている場合に、RTTの速い方からデータを取得するため、DNSなどの影響もあるが要求が発生した時点でトラフィックの低い方からデータを取得すると仮定できる。したがって、取得件数の多い方が、この実験に対するトラフィック効率が良く、転送速度も速いと思われたが、集計データにおける転送速度の差から優劣を付けられない。転送速度に差が現われない原因の一つに、両回線のうちのトラフィックの低い方からデータを取得し、トラフィックが高くなると、もう一方からデータを取得し、両回線のトラフィックが同程度になるように動作することが考えられる。 Fig. 3SINET回線とOCN回線から取得した件数を示したものである。取得した件数は最大でも1週間で1万件弱であり、取得した件数の増減により、 Table 2から転送速度に影響が及ぶことがないといえる。

 

 

3.3 曜日別の比較

 

 Table 3は、2経路からの取得したデータの件数と転送速度を、月曜日から日曜日を1週として、最近3週間の平均を曜日別にまとめたものである。Table 3 Fig. 4からLANとの接続において、SINET回線がOCN回線よりも高速であるにもかかわらず、利用者が非常に少ない日曜日においても、平日と同様な傾向である。これは、学内LANSINET回線間のトラフィック容量に関係がなく、SINETOCNのネットワーク構成と他のネットワークと接続するポイントや回線速度の問題であると判断できる。 Fig.5OCNネットワーク構成を知るために、NTTから提供を受けた平成109月頃の構成予定図である。

 

 

3.4 データ収集のためにSINET回線に占める割合

 

 SINETの回線のピーク時は、日別のトラフィックから飽和状態であると判断できるが、ここではデータ収集のため、SINET回線に占める大凡の割合を知るため、最近1ヶ月のトラフィック容量をFig.6に示す。Fig.6MRTG (Multi Router Traffic Grapher) の出力である。Fig.6(a)SINET用ルータと学内とを接続する学内ルータのポートのトラフィック量であり、 Fig. 6(b)SINET用プロクシキャッシングサーバと3台の子のプロクシキャッシングサーバのセグメントと接続しているルータのポートのトラフィック量である。前者の送受信量が外線とのトラフィック量であり、後者の受信量のみが外線とのトラフィック量である。したがって、後者の受信量の平均6.5KB/sに対し、前者の送受信量の平均が210.9KB/sであるから、この実験での平均利用率は3%程度である。このことより、WWWブラウザ利用端末がすべてプロクシキャッシングサーバに接続しても、現在の10倍程度の約2000台であり、キャシュのヒット率が高まることを考慮すると、WWWの取得のみに利用するのであれば、OCN回線の速度は1.5Mbpsで十分であると判断できる。

 

 

3.5 民間の回線との接続にあたって

 

 上述した結果から、民間との回線接続にあたり、以下のような問題点を考慮する必要がある。

 ・31で記載したように、 SINET回線からのデータの取得容量が95.1%から24.4%に減少した。このことは接続すべき会社や時期をどのように決定すべきかの問題を含んでいる。

 ・1.5Mbps回線から128Kbps回線に変更したにもかかわらず、その影響が現れなかった。このことは回線速度をどのように決定すべきかの問題を含んでいる。

 ・今回の報告はWWWの取得したデータ量に対するものであり、プロクシキャッシングサーバを利用することで経路分けができたが、他の取得したいデータや学内の公開サーバのデータの提供についての経路分けをどのように行うかが問題となる。

 

 

4.おわりに

 

本稿で示したように、OCN回線の構成や速度が急激に整備されてきていることが分かる。我々はSINETの利用はもちろんのこと、これからの高度情報化社会にインターネットを活用していく上で、民間の回線と接続する必要に迫られるであろう。また、これからのインターネット利用技術の進歩により、研究・教育のためのマルチメディア利用がますます盛んになっていくものと推測できる。しかし、研究・教育機関との情報交換は、SINET回線の利用で対応できるが、地域や民間との情報交換においては、民間の回線を利用する方がより良いレスポンスが得られるであろう。 情報の提供についての効果に関しては、試験的に、OCN回線とSINET回線の両方に接続されているWebサーバ(http://www.mpro.or.jp/http://mpro.ccr.kanazawa-u.ac.jp/)を民間プロバイダに加入している2人のユーザに調査してもらったところ、トップページの表示に1人は16秒と20秒、他の人は5秒と45秒であった。1回きりで条件も異なるが、いずれにしてもOCN回線の方がSINTET回線よりもレスポンスが良いと思われる。情報の提供方法についても機会があればいずれ調査をする予定である。

民間回線との接続についての問題点の解決には、この報告で行ったようなネットワーク構成で、最初は低速回線を借り受け、試行する方法も一考に価すると思われる。

 

謝辞、この実験の機会を与えて下さった経済学部の飯島泰裕先生に感謝いたします。

 

 

(1998717日受付;1998818日 採録)

(Received 17 July 1998; accepted 18 August 1998)