CityHost.UA
Помощь и поддержка

Анализ логов доступа с помощью GoAccess

GoAccess является консольным инструментом для визуального анализа логов доступа к сайту. Основное его назнаание заключается в сортировке всех записей в логах для отображения сортированных и структурированных данных и быстрого просмотра статистики.

 

GoAccess позволяет быстро просмотреть статистику по:

• посещаемости сайта, включая количество уникальных посетителей

• страницах к которым происходит наибольшее количество запросов

• IP адресам от которых происходит наибольшее количество запросов, в том числе поисковых ботов

• сетевом трафике, операционных системах и браузерах посетителей

• количеству запросов на сайт в зависимости от времени суток

• и прочее…

 

Данная инструкция частично базируется на двух следующих: [где находятся лог файлы сайтов] и [подключение через web-ssh]

 

Итак, если мы определили, какой лог файл будем просматривать, открываем окно ssh консоли (желательно развернуть его на весь экран) и вводим туда команду вместе с именем собственного лог файла, который будем анализировать, например:

goaccess $HOME/logs/SITE_NAME.access.log
Примечание: в команде вместо SITE_NAME укажите имя Вашего сайта.

 

Откроется окно, в котором будет предложено выбрать формат лог файла. На этом шаге нажимаем клавишу Пробел, после чего Энтер. После загрузки лог файла Вы увидите список отсортированных данных.

 

 

В верхней части отображается основная информация на английском языке.

 

Основная информация, которая здесь отображается:

Total Requests — Общее количество запросов на сайт

Unique Visitors — общее количество уникальных посетителей

Tx. Amount — использованный трафик

 

Вся остальная информация будет сгруппирована блоками ниже. Каждый блок будет иметь свою цифру для быстрого перехода к нему через клавиши на клавиатуре.

 

 

Каждый блок отображает отдельный список данных, а именно:

1. Unique visitors per day — количество уникальных посетителей сайта, в том числе поисковых ботов

2. Requested Files (URLs) — запросы по страницам

3. Static Requests — запросы к статическим файлам

4. Not Found URLs (404s) — запросы на страницы, которые вернули ошибку 404

5. Visitor Hostnames and IPs — IP адрес посетителя, его страна по имени хоста

6. Operating Systems — операционные системы посетителей

7. Browsers — интернет браузеры посетителей

8. Time Distribution — количество запросов в зависимости от времени суток

9. Модуль №9 отключен

10. Referrers URLs — откуда пришел посетитель

11. Referring Sites — сайт, с которого пришел посетитель

12. Keyphrases from Google — ключевые слова, которые привели пользователя на сайт

13. HTTP Status Codes — статус коды которые вернул сервер

14. Geo Location — страны посетителей

 

Кроме основной информации, отображающей блок, его можно развернуть для отображения дополнительных сведений. Вот, например, как выглядит развернутый блок №5, из чего можно заключить, что основными посетителями сайта были поисковые боты Google.

 

 

В общем, основное управление утилитой можно свести к нескольким клавишам:

TAB — переход между отдельными информационными блоками.

? (стрелка вправо) — развертывание блока и просмотр дополнительных сведений

?? (стрелки вниз и вверх) — прокрутка информации на странице

 

Для полноценного управления утилитой существует следующий перечень клавиатурных сокращений:

F5 — обновление информации в окне программы

Q — действие назад, или выход из программы

O или Enter — развернуть выбранный блок

0-9, SHIFT+0-9 — быстрый переход к блоку по его цифре

J — перемещение курсора вниз внутри блока

K — перемещение курсора вверх внутри блока

CTRL+F — переход на следующую страницу внутри блока

CTRL+B — переход на страницу обратно внутри блока

SHIFT+TAB — переход назад между блоками

S — параметры сортировки в выбранном блоке.

/ — поиск текста внутри всех блоков (разрешается regex)

N — найти следующее поисковое совпадение