Материал просмотрен 288 раз(а)

Бывает и такое, что хочется настроить свой веб-сайт максимально хорошо, исправив все ошибки кривой CMS или рук и вполтную заняться раскруткой сайта. В чём это выражается? Распухает error_log файл веб-сервера. То есть что туда пишется? Все сообщения о не найденных ресурсах (страницы, картинки, таблицы стилей), ошибки доступа (запрет на доступ к разным файлам). Да мало ли что ещё. Хотелось бы, чтобы ошибок не было или было минимально. Но просматривал лог-файл – это кажется очень уж невероятным чем-то.

Я воспользовался следующим способом:

Копируем лог-файлы интересующих нас сайтов

Как правило, они лежат в /var/log/apache/<error_log> или /var/log/nginx/<error_log>. Копируем эти логи в нужный нам каталог или выносим с сервера.

Берём скрипт разбора

Взял готовый скрипт (log-reader-master.zip) с github (https://codeload.github.com/rnixik/log-reader/zip/master), распаковываем на свой сервер в каталог и немного правим файл example_nginx.php, а именно указываем файл лога. При желании можно немного подредактировать скрипт, но мне хватило базовых функций.

Указываем наш лог

Указываем наш лог

Открываем скрипт в браузере

Получаем весьма информативную табличку с нужными нам полями. Обращаем внимание на поля Message и Host+Request. Здесь разбираем ошибку в Message, обращая внимание на поле Request, чтобы знать, где её фиксить.

Что в браузере

Что в браузере

Копируем в Excel

А ещё лучше всю эту табличку перекопировать в Excel и провести дедупликацию данных, тогда останется намного меньше спорных вопросов (а только уникальные ошибки), которые и нужно разбирать.

Делается это через пункт меню Данные – Удалить дубликаты. А там удаляем дубли в столбце Message, чтобы оставить только уникальные ошибки.

Дедупликация

Дедупликация

После того, как мы их пофиксили (скопировали файлы, поправили ссылки) очищаем старый лог-файл (тем же echo > logfile), и ждём следующую порцию ошибок.