Re[15]: Hello UNIX!
От: Anton Batenev Россия https://github.com/abbat
Дата: 24.08.15 21:52
Оценка:
Здравствуйте, Mamut, Вы писали:

M> 1. Поля настриваются в импортере логов. Даже если нет полей, rex, после чего — все остальные запросы.


Как я и говорил — фигурное выпиливание (и mode=sed говорит сам за себя). И чем дальше я буду переходить от общего к частному (конкретно к своим логам во всем их многообразии), тем больше это будет тем самым sed-ом в консоли, только плюс "прицеп", который нужно будет поддерживать.

M> 2. Про «тривиальные выборки» смешно, да. Я вот жду, может ты покажешь, как awk'ом и sed'ом я не знаю, персентили вытаскивать. Или outlier'ы на каких-то значениях.


Ну можно и на awk (хотя обычно делаю по другому):

... | sort -n | awk '{ s[NR] = $1; } END { print int(NR * 0.9); }'


Что такое outlier'ы я не знаю, но если имеется ввиду какая-то нетривиальная мат-статистика, то тут бы я просто делегировал эту задачу R.

M> AB>P.S. У данных продуктов есть своя ниша, где они будут "на своем месте", но для моих задач в большинстве случаев они не подходят.

M> Я вот тоже жду, может ты покажешь, как ты awk'ом парсишь 1.5 терабайта логов.

Беру и запускаю — тут нет каких-то особых хитростей.

M> ЗЫ. «Тривиальная выборка», за пределами которой «awk/sed/grep-оподобный скальпель»


Ты пытаешься мне "продать" аналитику, а я пытаюсь объяснить, что я не занимаюсь аналитикой (по крайней мере не в таком виде). Возможно в этом причина недопонимания.

Если мне (не дай бог) потребуется полезть в ту аналитику, которую ты описываешь, то я не буду заниматься извращениями с фигурным выпиливанием из сырых технических логов (которые, к тому же, могут не содержать требуемой информации), а добавлю в приложение необходимый для аналитики функционал — это может быть обычный csv лог, пригодный для импорта в базу, или сразу отправка данных через какой-нибудь api — это дело уже десятое, ни к *nix ни к консоли не имеющее отношения.
... в первом классе мне говорили, что нужно делиться, а теперь говорят, что это незаконно ...
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.