aptsvet: (Default)
aptsvet ([personal profile] aptsvet) wrote2010-03-05 01:28 pm

Помощь зала

Мозги заклинило, а может там и заклинивать нечего. Как будет по-русски data mining, существует ли устойчивое выражение, позволяющее не растекаться на абзац?

[identity profile] rupasov.livejournal.com 2010-03-05 08:35 pm (UTC)(link)
Самый адекватный перевод - "анализ данных". Не думаю, что можно что-то лучше придумать.

[identity profile] oldthinker.livejournal.com 2010-03-05 08:54 pm (UTC)(link)
Этот вариант мне кажется лучшим из всех обсуждавшихся (в смысле меньшего из зол). Хотелось бы, конечно, отразить разницу между mining и analysis, но "добыча" ее не ухватывает.

[identity profile] rupasov.livejournal.com 2010-03-05 09:03 pm (UTC)(link)
Добыча тут вообще не при делах. "Добыча" в русском означает, что данных нет и мы должны из где-то искать. Data mining означает ровно обратное - что данные есть и их очень много. И их надо обработать, промыть - найти в большой куче руды маленький самородок. В русском это называется "анализ".

[identity profile] 2-87-i-baton.livejournal.com 2010-03-05 09:14 pm (UTC)(link)
Может быть колымские старатели и занимаются с утра до вечера "анализом" породы, но вот в многомерном информационном пространстве принято отбирать данные на основе заранее определенных критериев для последующего анализа или описания.

[identity profile] aptsvet.livejournal.com 2010-03-05 09:21 pm (UTC)(link)
Вот тут мы тебя и поправим. Для отбора надо получить доступ ко всем, то есть к сырым. Data mining - это как раз доступ в сочетании с отбором.

[identity profile] 2-87-i-baton.livejournal.com 2010-03-05 09:42 pm (UTC)(link)
Информационные массивы имеют разные свойства и происхождение. Некоторые действительно нужно предварительно формализовать и упорядочить, т.е. получить доступ, а уж затем отбирать данные, но есть и готовенькие - подходи и бери. Поскольку вариантов отбора значительно больше, чем способов формализации, о ней, т.е. о доступе, и не вспоминают, а говорят об отборе данных. Так, по крайней мере, было в местном обиходе, когда я некоторое время был влюблен в многомерность информационныго пространства.

[identity profile] rupasov.livejournal.com 2010-03-06 08:51 am (UTC)(link)
"Подходи и бери" - это не про data mining. Data mining - это "пойти туда, не знаю куда, принеси то, не знаю что".

[identity profile] oldthinker.livejournal.com 2010-03-05 09:53 pm (UTC)(link)
У английского термина есть широкий и узкий смысл. В широком смысле data mining включает в себя "отбор данных на основе заранее определенных критериев для последующего анализа или описания"; в узком смысле это только извлечение информации из данных. В узком значении "mining" не вполне логично, и совсем не обязательно сохранять эту нелогичность в переводе. Таким образом, "анализ информации" вполне годится для узкого значения; вопрос о русском эквиваленте широкого значения остается открытым. Я выше предлагал "добыча информации".

[identity profile] rupasov.livejournal.com 2010-03-06 08:50 am (UTC)(link)
Так получилось, что я в этой области тружусь. Слово "добыча" там не употребляется вообще. Слово "отбор" употребляется для обозначения простой фильтрации, что не есть data mining. Для того, что есть data mining (например, для поиска корреляций) используется слово "анализ".