Содержание
Бывает и такое, что хочется настроить свой веб-сайт максимально хорошо, исправив все ошибки кривой CMS или рук и вполтную заняться раскруткой сайта. В чём это выражается? Распухает error_log файл веб-сервера. То есть что туда пишется? Все сообщения о не найденных ресурсах (страницы, картинки, таблицы стилей), ошибки доступа (запрет на доступ к разным файлам). Да мало ли что ещё. Хотелось бы, чтобы ошибок не было или было минимально. Но просматривал лог-файл – это кажется очень уж невероятным чем-то.
Я воспользовался следующим способом:
Копируем лог-файлы интересующих нас сайтов
Как правило, они лежат в /var/log/apache/<error_log> или /var/log/nginx/<error_log>. Копируем эти логи в нужный нам каталог или выносим с сервера.
Берём скрипт разбора
Взял готовый скрипт (log-reader-master.zip) с github (https://codeload.github.com/rnixik/log-reader/zip/master), распаковываем на свой сервер в каталог и немного правим файл example_nginx.php, а именно указываем файл лога. При желании можно немного подредактировать скрипт, но мне хватило базовых функций.
Открываем скрипт в браузере
Получаем весьма информативную табличку с нужными нам полями. Обращаем внимание на поля Message и Host+Request. Здесь разбираем ошибку в Message, обращая внимание на поле Request, чтобы знать, где её фиксить.
Копируем в Excel
А ещё лучше всю эту табличку перекопировать в Excel и провести дедупликацию данных, тогда останется намного меньше спорных вопросов (а только уникальные ошибки), которые и нужно разбирать.
Делается это через пункт меню Данные – Удалить дубликаты. А там удаляем дубли в столбце Message, чтобы оставить только уникальные ошибки.
После того, как мы их пофиксили (скопировали файлы, поправили ссылки) очищаем старый лог-файл (тем же echo > logfile), и ждём следующую порцию ошибок.
Comments: