Анализ лог-файлов¶
Базовая оценка: 1 балл
Написать на любом языке программирования (подсказка: проще всего на языке со скриптинговыми возможностями) скрипт, который выдаст отчет по текстовому лог-файлу log.txt с таким содержанием:
- Топ 10 URL по хитам (c количеством хитов)
- Топ 10 клиентов по количеству обращений к этим 10 URL (c количеством хитов)
- Топ 10 URL по скаченным байтам (с объемом байт)
- Топ 10 URL, которые вернули ошибку 404 (c количеством хитов)
- Топ 10 рефереров (с количеством хитов)
- Количество хитов по дням
Хит — это одна загрузка веб-страницы по данному адресу.
Пример записи в лог-файле:host-24-225-218-245.patmedia.net - - [01/Oct/2006:06:33:45 -0700] "GET /example/example.atom HTTP/1.1" 304 - "-" "NetNewsWire/2.0b37 (Mac OS X; Lite; http://ranchero.com/netnewswire/)"
Формат записи: <DNS клиента> - - [<Штамп времени>] <Строка HTTP-запроса (тип, URL, версия)> <Код HTTP-ответа> <Количество переданных байт> <Строка реферера> <Название клиента>