Мозги заклинило, а может там и заклинивать нечего. Как будет по-русски data mining, существует ли устойчивое выражение, позволяющее не растекаться на абзац?
Этот вариант мне кажется лучшим из всех обсуждавшихся (в смысле меньшего из зол). Хотелось бы, конечно, отразить разницу между mining и analysis, но "добыча" ее не ухватывает.
Добыча тут вообще не при делах. "Добыча" в русском означает, что данных нет и мы должны из где-то искать. Data mining означает ровно обратное - что данные есть и их очень много. И их надо обработать, промыть - найти в большой куче руды маленький самородок. В русском это называется "анализ".
Может быть колымские старатели и занимаются с утра до вечера "анализом" породы, но вот в многомерном информационном пространстве принято отбирать данные на основе заранее определенных критериев для последующего анализа или описания.
Информационные массивы имеют разные свойства и происхождение. Некоторые действительно нужно предварительно формализовать и упорядочить, т.е. получить доступ, а уж затем отбирать данные, но есть и готовенькие - подходи и бери. Поскольку вариантов отбора значительно больше, чем способов формализации, о ней, т.е. о доступе, и не вспоминают, а говорят об отборе данных. Так, по крайней мере, было в местном обиходе, когда я некоторое время был влюблен в многомерность информационныго пространства.
У английского термина есть широкий и узкий смысл. В широком смысле data mining включает в себя "отбор данных на основе заранее определенных критериев для последующего анализа или описания"; в узком смысле это только извлечение информации из данных. В узком значении "mining" не вполне логично, и совсем не обязательно сохранять эту нелогичность в переводе. Таким образом, "анализ информации" вполне годится для узкого значения; вопрос о русском эквиваленте широкого значения остается открытым. Я выше предлагал "добыча информации".
Так получилось, что я в этой области тружусь. Слово "добыча" там не употребляется вообще. Слово "отбор" употребляется для обозначения простой фильтрации, что не есть data mining. Для того, что есть data mining (например, для поиска корреляций) используется слово "анализ".
no subject
no subject
no subject
no subject
no subject
no subject
no subject
no subject
no subject