Limit transferu jest graniczną liczbą przesłanych danych w jednostce czasu w ramach serwera wirtualnego. Przekroczeniu tego limitu spowoduje zablokowanie Waszej witryny i wyświetlenie strony zastępczej ze stosownym komunikatem. W tym rozdziale przedstawimy metodę szacowania przybliżonego ruchu dla witryn o małej i średniej ilości odwiedzin.
Sposób naliczania ruchu
Jeśli nie były wykupowane dodatkowe limity transferu to zwykle limit wynosi od 8 do 72 GB miesięcznie (w zależności od wybranego pakietu Hostigo Web). Limit ten jest podzielony na tygodniowe fragmenty i naliczane dla każdego z osobna, zatem limit wynosi od 2 do 16 GB na tydzień. Licznik ruchu jest zerowany co tydzień, przy czym nie jest to stała pora. Dla każdej strony może to być inna godzina, jest to związane z godziną założenia konta u nas. Sposób pomiaru bieżącego stanu licznika oraz ilość ruchu jaki był wykorzystany przez ostatnie miesiące zbadamy za pomocą miernika ruchu i statystyk.
Co jest wliczane do limitu ruchu?
Do limitu transferu liczony jest tylko ruch serwera HTTP. Poczta elektroniczna i FTP nie są limitowane. Aktualny stan licznika ruchu to suma wszystkich pobranych plików od czasu jego wyzerowania. Dotyczy to wszystkich plików pobranych za pośrednictwem protokołu HTTP z serwera o danej domenie.
Jak oszacować konieczny limit dla strony WWW?
Załóżmy, że suma wielkości plików wchodzących w skład strony WWW wynosi średnio 40KB. Przy dziennym limicie transferu 400MB ta strona w najgorszym wypadku może zostać pobrana 10000 razy. Oprócz elementów tworzących stronę często są pliki do pobrania, np. cenniki czy katalogi. Mają one nierzadko dużą objętość (wiele megabajtów) przez co pobieranie ich bardzo szybko wyczerpuje przydzielony ruch HTTP. Efektywnie jednak transfer pozwala na większą ilośc odwiedzin, jest to związane z kompresją (w locie) danych po stronie serwera i, mechanizmami buforowania.
Poniżej został przykład sposobu szacowania wymaganego limitu transferu w najgorszym możliwym przypadku (jeśli żadne dane nie są buforowane po stronie klienta):
Przykład:
Zakładamy że:
- strona ma średnio 60KB wielkości i będzie pobierana 400 razy na dobę
- zamieszczono plik z prezentacją o objętości 2MB, który będzie pobierany 150 razy na dobę
60KB * 400 = 24MB 2MB * 150 = 300MB
Łączny transfer dobowy wyniesie 324MB (9,7GB/mies), co stanowi ponad 75% dopuszczalnego limitu. Powyższe założenia są obarczone dużym błędem ze względu na trudność określenia ilości odwiedzin. Dla naszego przykładu należy być przygotowanym, że pewnego dnia limit zostanie przekroczony (jeśli firma się rozwija). W takim wypadku konieczne będzie dokupienie pakietów transferu.
Ilości odwiedzin przykładowych serwisów
Poniżej przedstawiliśmy kilka przykładów z utrzymywanych u nas serwisów:
- 25/dobę - witryna cukierni typu "wizytówka"
- 600/dobę - strona znanej polskiej pisarki
- 720/dobę - witryna wydawnictwa o długiej tradycji
- 1200/dobę - sklep internetowy z produktami motoryzacyjnymi
- 5000/dobę - internetowy sklep komputerowy
Jak widać najwyższe miejsce w zestawienie zajmują strony powszechnie znanych osób i podmiotów, zatem duża ilość odwiedzin jest w pełni uzasadniona. Następne w kolejności są strony służące do prowadzenia działalności handlowej w sieci, jednak w tym wypadku rozbieżności mogą być bardzo duże. Zupełnie inną miarą należy mierzyć sklepy internetowe o olbrzymiej popularności, serwisy aukcyjne, czy witryny oferujące duże ilości plików do pobrania. Takie serwisy potrafią generować olbrzymie ilości ruchu i zazwyczaj są umieszczane na hostingu dedykowanym - nimi nie będziemy się zajmować. Na ostatnim miejscu znajdą się strony czysto informacyjne i strony typu "wizytówka".
Jak zmierzyć wielkość strony WWW?
Możemy użyć wyspecjalizowanej wtyczki do naszej przeglądarki, która umożliwi zmierzenie objętości wszystkich pobieranych plików dla danego adresu. Jeśli nie wiemy jak taki dodatek zainstalować to możemy najzwyczajniej zapisać stronę na dysk i sprawdzić sumę wielkości plików, które wchodzą w jej skład. Musimy dokonać pomiarów dla kilku najbardziej popularnych podstron i wyliczyć średnią wielkość. Przykładowo strona którą właśnie oglądacie zajmuje ok. 58KB
Nieoczekiwane skoki zapotrzebowania na ruch
Bez względu jak precyzyjnie oszacujemy transfer i czy obliczenia będą się pokrywały z pomiarami musimy spodziewać się trudnych do przewidzenia wahań. Rzadko kiedy następuje gwałtowny wzrost popularności strony bez żadnej uzasadnionej przyczyny, zwykle jest to następstwo nieprzemyślanych działań. Poniżej przedstawiamy listę kilku przykładów wziętych z życia, gdzie wzrost liczby pobrań zakończył się zablokowaniem witryny:
- opublikowaniu galerii zdjęć ze studniówki na stronie szkoły średniej
- zareklamowanie strony w mediach
- umieszczenie sporego pliku do pobrania, który cieszył się dużą popularnością
- uruchomienie forum dyskusyjnego
- sezonowy wzrost ilości odwiedzin witryny, na której reklamują się właściciele domków letniskowych
- stworzenie mirrora[1] znanego katalogu stron internetowych
- użycie zdjęć produktów do wyświetlenia na dużym, polskim serwisie aukcyjnym
Jak widać należy się dobrze zastanowić co się robi. O ile w przypadku reklamy w mediach trzeba się pogodzić z ze straconymi pieniędzmi, o tyle bardziej bolesne jest użycie jakichkolwiek elementów w innych serwisach (np. aukcyjnych), gdyż wiąże się to z natychmiastowym rozwiązaniem umowy. Zupełnie nieprzemyślanym przykładem było umieszczenie u siebie mirrora katalogu DMOZ[2], serwis ten został zablokowany po wizycie tego samego dnia dwóch botów[3] (tzw. pająków internetowych) indeksujących treść stron dla wyszukiwarek.
Gorąco zachęcamy do konsultowania z nami działań, które podejrzewacie o to że mogą zwiększyć liczbę odsłon Waszej witryny.
Diabeł tkwi w szczegółach
Istnieje wiele zjawisk, które podważają wiarygodność powyższych obliczeń i wskazań statystyk, dlatego należy je traktować orientacyjnie.
Pamięć podręczna (cache)
Osoba wchodząca po raz kolejny na daną stronę nie pobiera wielu elementów strony (grafiki, arkuszy stylów, itp.), gdyż ma je zbuforowane w pamięci podręcznej przeglądarki[4] lub serwerze typu w3cache[5]. Buforowanie danych po stronie klienta powoduje zmniejszenie zapotrzebowania na transfer.
Pająki wyszukiwarek
Pająki internetowe regularnie odwiedzają naszą stronę i pobierają jej zawartość, tyle że bez grafiki. Poza nielicznymi wyjątkami pobierają stosunkowo mało danych, ponadto odwiedzają nasz stronę stosunkowo rzadko (raz na kilka dni/tygodni). Jeśli mamy duże ilości danych tekstowych, które nie powinny być indeksowane należy do katalogu ze stroną dodać odpowiednio przygotowany plik robots.txt[6]. Pająki zapotrzebowanie na zwiększają transfer, są jednak niezbędne do działania wyszukiwarek.
Trzeba liczyć się z tym, że pająki w skrajnych wypadkach mogą zwiększyć zapotrzebowanie na pasmo kilkukrotnie.
Spam harvestery
Harvestery[7] to automaty działające bardzo podobnie jak pająki internetowe, jednak ich zadaniem jest zbieranie adresów e-mail, w celu późniejszego rozsyłania spamu. Jak się łatwo domyślić Harvestery nie respektują wpisów w pliku robots.txt, ponadto mogą nas odwiedzać częściej niż pająki. Harvestery mają działanie pasożytnicze, zwiększają wymagany transfer.
