Сбор информации

Информационные процессы (сбор, обработка и передача информации) всегда играли важную роль в науке, технике и жизни общества. В ходе эволюции человечества просматривается устойчивая тенденция к автоматизации этих процессов, хотя их внутреннее содержание по существу осталось неизменным.

Сбор информации – это деятельность субъекта, в ходе которой он получает сведения об интересующем его объекте.

Сбор информации может производиться или человеком, или с помощью технических средств и систем – аппаратно. Например, пользователь может получить информацию о движении поездов или самолетов сам, изучив расписание, или же от другого человека непосредственно, либо через какие-то документы, составленные этим человеком, или с помощью технических средств (автоматической справки, телефона и т. д.). Задача сбора информации не может быть решена в отрыве от других задач, – в частности, задачи обмена информацией (передачи).

Обмен информацией – это процесс, в ходе которого источник информации ее передает, а получатель – принимает.

Если в передаваемых сообщениях обнаружены ошибки, то организуется повторная передача этой информации. В результате обмена информацией между источником и получателем устанавливается своеобразный “информационный баланс”, при котором в идеальном случае получатель будет располагать той же информацией, что и источник.

Обмен информации производится с помощью сигналов, являющихся ее материальным носителем. Источниками информации могут быть любые объекты реального мира, обладающие определенными свойствами и способностями. Если объект относится к неживой природе, то он вырабатывает сигналы, непосредственно отражающие его свойства. Если объектом-источником является человек, то вырабатываемые им сигналы могут не только непосредственно отражать его свойства, но и соответствовать тем знакам, которые человек вырабатывает с целью обмена информацией.

Принятую информацию получатель может использовать неоднократно. С этой целью он должен зафиксировать ее на материальном носителе (магнитном, фото, кино и др.).

Накопление информации – это процесс формирования исходного, несистематизированного массива информации.Среди записанных сигналов могут быть такие, которые отражают ценную или часто используемую информацию. Часть информации в данный момент времени особой ценности может не представлять, хотя, возможно, потребуется в дальнейшем.
Хранение информации – это процесс поддержания исходной информации в виде, обеспечивающем выдачу данных по запросам конечных пользователей в установленные сроки.Обработка информации – это упорядоченный процесс ее преобразования в соответствии с алгоритмом решения задачи. После решения задачи обработки информации результат должен быть выдан конечным пользователям в требуемом виде. Эта операция реализуется в ходе решения задачи выдачи информации. Выдача информации, как правило, производится с помощью внешних устройств ЭВМ в виде текстов, таблиц, графиков и пр.

Информационная техника представляет собой материальную основу информационной технологии, с помощью которой осуществляется сбор, хранение, передача и обработка информации.

До середины XIX века, когда доминирующими были процессы сбора и накопления информации, основу информационной техники составляли перо, чернильница и бумага. Коммуникация (связь) осуществлялась путем направления пакетов (депеш).

На смену “ручной” информационной технике в конце XIX века пришла “механическая” (пишущая машинка, телефон, телеграф и др.), что послужило базой для принципиальных изменений в технологии обработки информации.

Понадобилось еще много лет, чтобы перейти от запоминания и передачи информации к ее переработке. Это стало возможно с появлением во второй половине нашего столетия такой информационной техники, как электронные вычислительные машины, положившие начало “компьютерной технологии”.

Древние греки считали, что технология (techne – мастерство + logos – учение) – это мастерство (искусство) делать вещи. Более емкое определение это понятие приобрело в процессе индустриализации общества. 

Технология – это совокупность знаний о способах и средствах проведения производственных процессов, при которых происходит качественное изменение обрабатываемых объектов. 

Технологиям управляемых процессов свойственны упорядоченность и организованность, которые противопоставляются стихийным процессам. Исторически термин “технология” возник в сфере материального производства. Информационную технологию в данном контексте можно считать технологией использования программно-аппаратных средств вычислительной техники в данной предметной области.

Информационная технология – это совокупность методов, производственных процессов и программно-технических средств, объединенных в технологическую цепочку, обеспечивающую сбор, обработку, хранение, распространение и отображение информации с целью снижения трудоемкости процессов использования информационного ресурса, а также повышения их надежности и оперативности. 

Информационные технологии характеризуются следующими основными свойствами: 

Из всех видов технологий информационная технология сферы управления предъявляет самые высокие требования к “человеческому фактору”, оказывая принципиальное влияние на квалификацию работника, содержание его труда, физическую и умственную нагрузку, профессиональные перспективы и уровень социальных отношений.

Источник: http://solidstate.karelia.ru/p/tutorial/informatics/chapter2/5/51.htm

Работа с информацией. Этап поиска и сбора информации

Сбор информации

Опубликовал Николай Медведев – 18 августа, 2014

Добрый день, уважаемые читатели !

Продолжим тему «Работа с информацией» и сегодня о первом этапе – Поиск и сбор информации.

****

Если есть задача/ проблема/ цель, но нет ее решения, — то неизбежно наступает этап поиска этого решения.

И чем правильнее сформулирована проблема, тем проще найти решение.

Если проблема тривиальная, то достаточно одного шага в поиске информации – открываем поисковую систему в Интернете, делаем запрос – и имеем несколько источников информации.

Основной навык, требуемый в этих случаях – правильно составить запрос. Но это тоже нужно сделать грамотно и этому нужно также учиться.

Думаю, что 90 % людей ограничиваются именно этим уровнем работы с информацией. Возникла проблема – зашел в поисковик – получил ответ.

Если задачи не выходят за эти рамки, а именно – найти ответ на бытовой вопрос или быть в курсе новостных событий, — то заморачиваться по поводу выстраивания персональной системы работы с информацией, видимо не стоит.

Для тех же, у кого работа с информацией заключается в необходимости сбора и обработки больших массивов, выраженных в 1 000 единиц файлов или книг, — создание системы работы с информацией будет просто необходимо.

Потребность в системе работы с информацией

У любого специалиста высокого уровня существует своя библиотека знаний.

Знания не имеют границ и требуют постоянного совершенствования и обновления.

Сбор информации в этом случае носит систематический характер. Т.е. информация вносится в базу знаний – постоянно.

Но потребность в системе работы с информацией возникает не только у профессиональных специалистов, возникает она и на бытовом уровне, в личной жизни каждого человека, который стремится к саморазвитию или хотя бы к упорядочению своей жизни.

Жизнь может протекать как сплошной поток непрерывной деятельности. В таком потоке сложно выделить и структурировать отдельные части. Человек живет и все, ему этого достаточно.

Но нашу жизнь можно разнообразить, структурировать наши жизненные цели, придать смысл существованию и всей нашей жизни.

Вам уже скорее всего известен такой инструмент анализа текущего состояния как «Колесо жизни». Оно позволяет оценить вашу текущую ситуацию и определить в каких сферах необходимо развитие.

Таких сфер/направлений может быть несколько (как правило, не более 10): «Здоровье», «Духовное развитие», «Спорт», «Карьера», «Семья», «Финансы» и т.д.

Совершенствование в любой сфере требует знаний. И начинается этот  процесс со сбора информации, а именно с формирования личной библиотеки по этим темам.

Итак, наличие системы работы с информацией требуется как на работе, так и в личной жизни. Между работой и личной жизнью, как известно должен быть баланс.

Зачем мы собираем информацию?

Чтобы сбор информации не превратился в самоцель, определимся – зачем же мы собираем информацию.

«… мы собираем информацию не для того, чтобы накапливать знания, а для того, чтобы предпринимать правильные действия», – это сказал гуру менеджмента Питер Ф. Друкер.

Это важно помнить, что сбор информации не ради сбора и не только для накопления знаний, но в итоге – для принятия верных решений и достижения наших целей, независимо на работе или в быту.

Когда, где и как собирать информацию?

Ответим на эти вопросы.

Когда ?

Если формируется база знаний специалиста – то информация пополняется постоянно. Возникла новая информация, привлек внимание заголовок – информация сразу поступает в эту базу.

Можно сформировать папку «Для рассмотрения» и регулярно проводить обработку новой информации, удаляя ненужную, а нужную распределяя по тематическим каталогам вашей системы (о систематизации информации поговорим в следующих статьях).

Если же решается конкретная задача требующая принятия решения, то сбор информации может носить ситуативный характер и быть разовым. Т.е. собрали- проблему решили – получили отчет – отчет на хранение.

Это как управление в Компании: может быть регулярный менеджмент, а может ситуативный. И тот и другой, как ни странно работает.

Но управляемость, прозрачность, отсутствие суеты и стрессов и в конечном итоге — результативность у регулярного менеджмента намного выше.

Т.е. отвечая на вопрос – когда — можно по ситуации, но безусловно лучше – регулярно и используя Технологии.

Где собирать информацию?

Для этого вспомним, что есть информация первичная и вторичная.

Вторичная – это информация, которая уже имеется в каком либо источнике, например в книгах,  журналах, бухгалтерских данных, в отделе статистики, в отчетах, ранее проведенных исследованиях и тд.

Первичная – это информация, которая получается непосредственно для целей решения данной проблемы. Это различные опросы, интервью, наблюдения.

Вторичная информация собирается, как правило, в процессе кабинетных исследований без привлечения других. Место: рабочее место, библиотека.

Если приобретаются уже проведенные исследования – то делаем соответствующий запрос и оплату.

Думаю, что это понятно. Вторичная – это уже имеющаяся информация на каком либо носителе.

С этой информацией в основном и работают, считая что информация существует только в таком виде.

Но, получить более качественную информацию можно опросив эксперта по данному вопросу, или нескольких экспертов, чтобы сопоставить точки зрения.

Или провести опрос клиентов, чтобы получить информацию — что же они думают про Вашу компанию, продукт и обслуживание.
Или провести мозговой штурм, среди сотрудников, чтобы получить нетривиальное решение проблемы.

 
Все это относится к сбору первичной информации.

Руководитель может принимать решения – выслушав мнение одного –двух своих специалистов. В этом случае он также занимается сбором первичной информации.

Наблюдение за поведение человека, например в торговом зале – это также сбор первичной информации, на основе которой принимаются решения по размещению витрин, например.

Итак, первичная информация – это информация, которой еще нет на каком-либо носителе и нам приходится ее собирать общаясь с другими людьми.

Думаю, что так будет более-менее понятно в общих чертах.

Как собирать информацию?

Ответим на этот вопрос, т.е. определим какие методы сбора информации существуют.

Как я уже говорил в статье « Умение работы с информацией» – важно знать этапы и методы работы на каждом этапе.

Сейчас мы рассматриваем первый этап – поиск и сбор информации. И подошли к методам сбора информации.

 Методы поиска информации:

1. Аудит своей знаниевой базы информации.

У вас уже имеется накопленная база данных в виде: файлов, книг, аудио и видео материалов. Первое что можно сделать – это поискать среди уже имеющейся у вас информации.

Как правило – если информация правильно систематизирована и кодифицирована, сделать это несложно. Достаточно задать Поиск по имени файла или другим способом, в соответствии с вашей кодификацией.

Если информация не систематизирована, то можно сделать поиск – по ключевым словам в тексте документа. Эти операции позволяет провести Microsoft Windows.

Таким образом указав нужные критерии запроса (ключевые слова) вы легко найдете подходящие папки и файлы внутри вашей базы.

Второй шаг – это поиск в вашей библиотеке — книг и журналов в печатном виде.

Расширение списка книги можно сделать следующим образом:

Начать с составления списка.

В своей книге «Как читать деловую литературу» я приводил основные источники получения информации для составления списка:

1. Рекомендации друзей и коллег.

2. Различные ссылки, содержащиеся в уже изученных ранее книгах.

3. Поиск списков литературы на специализированных форумах.

4. Различные подписки на специализированные рассылки.

5. Участие в различных электронных сообществах, посвященных Вашей тематике.

6. Посещение магазинов, в том числе поиск в Интернет-магазинах.

7. Обращения к специалистам с просьбой порекомендовать нужную литературу.

Это основные источники для получения списка важных книг по теме

2. Кабинетные исследования.

Получив информацию из существующей у вас базы Знаний, вы дополняете ее путем:

Работа с библиотечным фондом в центральных библиотеках, запросы в статистические и архивные службы.

Работа в поисковых системах.

Просмотр телепередач, видео и аудио–материалов.

На этом этап работы со вторичной информацией можно закончить и приступить при необходимости к сбору первичной информации.

3. Общение с экспертами по интересующей теме.

Часто эксперты дают «зацепки» по которым можно расширить область поиска информации. Узнать у эксперта – какие источники информации наиболее важные, какие книги почитать в первую очередь и тд.

Доступность экспертов в настоящее время облегает Интернет. Достаточно набрать на свой вопрос – и появится масса видеоматериалов, лекций, семинаров. Остается только выбрать действительно приличных экспертов.

Но лучше использовать живое общение, тем самым расширяя свои связи и улучшая навыки коммуникаций.

4. Непосредственное наблюдение.

Это один из методов сбора первичной информации. Например чтобы снять соц-дем портрет посетителей торговой точки – достаточно выделить один наиболее насыщенный потоком день и заполнить таблицу – группы по возрасту, полу и времени. Очень полезная информация для решений.

5. Опросы, анкетирование, тестирование.

Методик может быть множество: это и фокус-группы, мозговые штурмы, использование модели Исикавы и тд.

На этапе сбора информации лучше создать некоторую избыточность, чтобы затем отобрать важное и полезное.

На этом ограничусь, думаю, что для первого раза по этапу поиск информации достаточно.

Источник: http://tehread.ru/rabota-s-informatsiey-etap-poiska-i-sbora-informatsii.html

Информационные процессы — урок. Информатика, 7 класс

Сбор информации

Процесс — это ход, развитие какого-нибудь явления; последовательная закономерная смена состояний (изменение) в развитии чего-либо.
Информационными процессами называют такие процессы, которые связаны с изменением информации или действиями с использованием информации.

Есть несколько основных информационных процессов:

  • cбор информации;
  • представление информации;
  • обработка информации;
  • хранение информации;
  • передача информации.

Узнавая новый номер телефона или адрес из телефонного справочника или записной книжки, мы собираем и сохраняем информацию.

При непосредственном разговоре с людьми, через переписку, с помощью телефона, радио или компьютерной сети, мы передаем и получаем информацию.

Пытаясь решить какую либо задачу, например, по математике, мы тем самым обрабатываем известную информацию.

Информационной деятельностью называют деятельность человека, которая связанна с процессами сбора, представления, обработки, хранения и передачи информации.

Рассмотрим теперь эти информационные процессы.

1) Сбор информации — осуществляется через наблюдение, чтение, общение, измерение и т. д. Со сбора информации начинается решение практически любой задачи.

Пример:

Для того чтобы знать, на какой спектакль вы сможете сходить в свой выходной, вам нужно выяснять автора и название пьесы. Чтобы выбрать профессию, связанную с производством и использованием компьютеров, вам нужно выяснить какие это профессии, в каком учебном заведении и на каком факультете можно приобрести такую специальность. То есть собрать соответствующие информации.

Для сбора информации часто используют различные измерительные устройства.

Пример:

Для того чтобы знать, какая на улице температура воздуха, нам нужен термометр.

Рис. 1.

Для того чтобы знать, с какой скоростью едет водитель автомобиля, нужен спидометр.

Рис.2.

2) Обработка информации — информационный процесс, в ходе которого информация изменяется содержательно или по форме.

Когда ученик отвечает на вопросы по биологии или решает математическую задачу, водитель автомобиля принимает решение о изменении скорости автомобиля, все они обрабатывают входную информацию. После обработки этой информации получается выходная информация. Обработку информации осуществляетисполнитель по определенным правилам. Исполнителем может быть человек, коллектив, животное, машина.

Рис. 3.

Пример:

Школьник, который являлся исполнителем, получил входную информацию в виде условия задачи, обработал информацию в соответствии с определенными правилами (например, правилами решения математических задач) и получил выходную информацию в виде искомого результата.

Обработка информации делится на два типа:

  1. получение нового содержания, новой информации: преобразование по правилам (по формулам), исследование объектов познания по их моделям, логические рассуждения, обобщения и др.;
  2. изменение формы представления информации, не изменяющая ее содержание: структурирование (организация информации по некоторому правилу, связывающему ее в единое целое), кодирование (переход от одной формы представления информации к другой, более удобной для восприятия, хранения, передачи или обработки информации), отбор (требуется для решения некоторой задачи, из информационного массива).

Для обработки большой информации главным помощником человека является компьютер. Компьютер позволяет на основании результатов измерений посчитать довольно большие числа, построить диаграммы и графики.

3) Хранение информации осуществляется с помощью её переноса на материальные носители. Зафиксировать информацию каким-нибудь способом означает сохранить информацию.

Информация хранится в памяти людей или же на каких-либо внешних носителях.

На протяжении нескольких столетий основным носителем информации является бумага. В наше время так же очень распространены электронные носители информации — флеш-карты, диске, аудио- и видеокассете.

Рис. 4.

Но самым важным хранилищем информации для человека является его память. На самом деле, каждый человек помнит свое имя, фамилию, домашний адрес, адреса и телефоны родных и знакомых. А если же человек не может вспомнить нужный адрес или телефон, ему в этом помогают записные книжки, телефонные справочники или другие долговременные носители информации.

4) Передача информации — процесс информации пространственного переноса от источника к получателю (адресату).

Распространение информации между людьми происходит в процессе ее передачи. Передача информации происходит через чтение книг, при разговоре по телефону, при просмотре телепередач и общении в компьютерной сети Интернет.

В передаче информации есть источник и есть приемник информации. Источник передает информацию, а приемник ее получает. А передача информации от источника к приемнику всегда происходит через канал связи.

Рис. 5.

Пример:

При телефонном разговоре двух людей, один из которых является источник, а другой приемником, в роле канала связи выступает телефонная связь.

Информационные процессы в живой природе и технике.

В живой природе, как и в мире людей, информация играет огромную роль. Информацию, поступающую из окружающей среды, способны воспринимать не только люди, но даже животные, растения, отдельные клетки и микроорганизмы улавливают сигналы и реагируют на них тем или иным способом.

Опадение листвы осенью и рост побегов весной, принятие определенной позы собакой при приближении соперника, выделение нужных веществ в цитоплазму амебы… Все эти явления живой природы — примеры изменений в системе после поступления информации.

С информационными процессами в технике мы сталкиваемся постоянно, ребенок, когда играет с управляемым автомобилем или кораблем, получает первое знакомство с информационными процессами в технике.

В некоторых случаях главную роль в процессе управления выполняет человек (например, вождение автомобиля), в других управление берет на себя само техническое устройство (например, кондиционер).

Источник: https://www.yaklass.ru/p/informatika/7-klass/informatciia-i-informatcionnye-protcessy-14542/informatciia-i-deistviia-s-informatciei-13890/re-37ead1b2-a516-40b0-bafb-446cdeac1184

О сборе данных. как собирать данные, анализировать их и грабить корованы

Сбор информации

В предыдущей статье мы рассматривали вопросы качества данных («О качестве данных и распространенных ошибках при их сборе» на Хабре). Сегодня я хочу продолжить разговор о качестве данных и обсудить их сбор: как правильно расставить приоритеты при выборе источника, как и какие данные собирать, оценка ценности данных для компании и другое.

Собирайте всё

Вы решили улучшить оформление и оплату товара на сайте? Отлично, а как проходит процесс формирования корзины покупателем? В какой момент он делает окончательный выбор товаров: до добавления в корзину или перед оплатой покупки? На каждом сайте может быть по разному, но как ведет себя клиент у вас? При обладании данными об оформлении заказа их можно проанализировать и определиться с вектором обновления, который будет удобен не только вам, но и пользователям.
Собирайте все данные, до которых дотягиваетесь. Вы никогда не будете знать со стопроцентной уверенностью, какие из них могут вам понадобится, а возможность сбора может выдаться только одна. Чем больше данных вы соберете, тем больше информации о пользователях у вас будет, а что важнее — вы сможете понимать и прогнозировать контекст их поступков. Контекст помогает лучше понимать своего клиента, его желания и намерения, а чем лучше вы знаете своего клиента, тем лучше вы сможете реализовать его персональные потребности, а значит повысить лояльность и повысить вероятность возврата клиента. Сегодня сбор абсолютно всех данных уже не такая редкость, особенно это распространено в онлайн проектах. В компании, максимизирующей сбор данных и умеющей с ними работать, на их основе будет вестись практически вся деятельность: маркетинг, продажи, работа персонала, обновления и усовершенствования, поставки. У каждого направления есть внутренние и внешние источники данных в различных форматах и разного качества. Это хорошо для работы аналитиков и принятия решений, но отсюда также возникает проблема с хранением этого массива данных и их обработкой. Каждое действие увеличивает финансовую нагрузку и положительный эффект от обладания данными может вырасти в «головную боль». Для принятия решения о целесообразности сбора и обработки тех или иных данных нужно понимание их основных характеристик. Давайте вкратце пройдемся по ним:

Объем

Показатель, влияющий на финансовые издержки по хранению и изменению данных и временные издержки по их обработке. И хотя с  увеличением объема данных цена на хранение единицы снижается, но, учитывая увеличивающееся количество источников, финансовая нагрузка может стать нерациональной.

Разнообразие

Разнообразный набор источников данных дает более полную картину и помогает лучше оценить контекст действий пользователя, но обратная сторона медали — разнообразие форматов и расходы на их интеграцию в вашу систему аналитики. Не всегда все данные возможно собрать воедино, а если и возможно, то не всегда это необходимо.

Скорость

Какой объем данных требуется обрабатывать в единицу времени? Вспомним недавние выборы президента США — благодаря быстрой обработке сообщений можно было понимать настроение избирателей в ходе дебатов и корректировать их ход. Гигантам работы с данными, таким как и Google, на достижение сегодняшних результатов потребовать огромное количество времени, но благодаря этому у них теперь есть данные о каждом пользователе и они могут прогнозировать их действия. Частая проблема персонала, работающего с данными — ограниченные ресурсы, в первую очередь финансовые и кадровые. В большинстве компаний аналитикам приходится расставлять жесткие приоритеты в выборе источников данных, и тем самым отказываться от некоторых из них. Кроме того необходимо учитывать интересы бизнеса, а значит оценивать рентабельность инвестиций в работу с данными и возможное влияние данных на компанию.

Приоритеты и выбор источников данных

При ограниченных ресурсах в работе с данными специалистам приходится расставлять приоритеты и делать выбор между источниками. Чем же руководствоваться при этом и как определить ценность данных для компании? цель работы аналитиков — давать необходимую другим подразделениям информацию качественно и своевременно.

Эта информация оказывает прямое влияние на эффективность компании и работу отделов. У каждого отдела или подразделения есть свой «основной» тип данных. Так для отдела по работе с клиентами важны контакты клиента и данные его социальных сетей, а для отдела маркетинга — история покупок и карта действий.

Так и выходит, что каждая команда имеет свой набор «очень важных данных» и эти данные определенно важнее и нужнее чем у других подразделений. Вот только от важности и нужности данных проблема с ограниченными ресурсами не исчезает, а значит приходится расставлять приоритеты и действовать в соответствии с ними.

Основной фактор для определения приоритетности данных — ROI, но не стоит забывать и про доступность, полноту и качество. Вот список в котором приведены некоторые показатели, которые могут помочь в расстановке приоритетов: Список параметров для расстановки приоритетовВысокая
Причина: Данные нужны немедленно.

Объяснение: Если у какого-то подразделения появляется острая необходимость в данных с жестко ограниченными сроками, такие данные предоставляются в первую очередь.

Высокая

Причина: Данные повышают ценность.
Объяснение: Данные повышают прибыль или сокращают издержки, обеспечивая высокую ROI.

Высокая

Причина: Разным командам требуются одни и те же данные.
Объяснение: Удовлетворяя потребности нескольких команд в данных вы повышаете ROI.

Высокая

Причина: Краткосрочные или потоковые данные.
Объяснение: Некоторые интерфейсы и протоколы дают ограниченное по времени «окно» для сбора данных, следует поторопиться.

Средняя

Причина: Дополнение для существующего набора данных, которые повышают их качества.
Объяснение: Новые данные дополняют имеющиеся и улучшают понимание контекста действий.

Средняя

Причина: Код обработки данных может быть использован повторно.
Объяснение: Использование известного кода сокращает ROI и уменьшает количество возможных ошибок.

Средняя

Причина: Данные легко доступны.
Объяснение: Если данные ценны, а добыть их просто — вперед.

Средняя

Причина: Удобный API позволяет собрать данные за прошедшие периоды.
Объяснение: Если данные не требуются еще вчера, а вы всегда можете получить к ним доступ, то не стоит ставить им слишком высокий приоритет.

Низкая

Причина: Аналитики имеют доступ к данным или иные пути их получения.
Объяснение: Если у аналитиков уже имеется доступ к данным, то, возможно, есть более приоритетные задачи.

Низкая

Причина: Низкое качество данных.
Объяснение: Низкокачественные данные могут быть бесполезны, а иногда и вредны.

Низкая

Причина: Необходимо извлечение из веб-страниц.
Объяснение: Обработка таких данных может быть достаточно сложной и требовать чрезмерных усилий.

Низкая

Причина: Низкая вероятность использования данных.
Объяснение: Данные, которые хорошо бы иметь, но если их нет, то и ладно.
Зато, обладая этими данными, можно грабить корованы!
Как мы видим не всякие данные важно предоставить «прямо сейчас», а значит необходимо расставлять приоритеты и следовать в соответствии с ними. Важно сохранять баланс между приобретением новых данных и их ценностью для компании.

Взаимосвязь данных

Вы получаете важные данные от отдела продаж, маркетинга, от логистов и обратную связь от клиентов, но самая большая ценность данных возникает после установления связей между разными видами данных. Для примера рассмотрим Диану и ее заказ.

Недавно она заказала комплект садовой мебели, сопоставив ее заказ с данными аналитики, мы видим, что она провела на сайте 30 минут и просмотрела 20 разных наборов. Это значит, что она выбирала мебель уже на сайте, не зная заранее, что будет заказывать. Смотрим откуда она пришла — поисковая выдача.

Если бы у нас была информация о других покупках Дианы, то мы бы узнали, что она за последний месяц часто покупала товары для дома. Частые онлайн покупки и использования поисковиков для нахождения интернет-магазинов говорит о низкой лояльности брендам, а значит склонить ее к повторной покупке будет сложно.

Так, получая каждый новый уровень информации, составляется индивидуальный портрет пользователя, по которому можно узнать о его жизни, привязанностях, привычках и прогнозировать его поведение. Добавляем информацию из оформления заказа и понимаем, что это женщина, а по адресу доставки видим, что она живет в частном секторе.

Продолжая анализировать можно найти информацию о ее доме и участке, спрогнозировать ее потребности и сделать превентивное предложение. При правильном анализе данных предложение может сработать и мы склоним клиента к повторной покупке, а так же повысим его лояльность за счет индивидуального подхода.

Предложение скидок за приглашение друга из соцсети даст нам доступ к  ее списку друзей и информации аккаунта, тогда можно будет продолжать индивидуальный маркетинговый подход к клиенту и составить под нее таргетированную рекламу, но это вряд ли будет рентабельно.

Сбор и покупка данных

Сегодня существует множество способов сбора данных, один из самых распространенных — API. Но кроме того как собрать данные, их нужно обновлять, и тут все уже зависит от объема.

Небольшие объемы данных (до 100 тысяч строк) целесообразнее заменять свежими, а вот с крупными массивами уже актуально частичное обновление: добавление новых и удаление устаревших значений.

Массивы некоторых данных настолько огромны, что обрабатывать их все будет слишком дорого для компании, в таких случая проводят выборку, и на ее основании проводят аналитику. Часто практикуется «простая случайная выборка», но обычно данные, собранные с ее помощью, не репрезентативны и сравнимы с подбрасыванием монетки.

Важный вопрос: собирать сырые или агрегированные данные? Некоторые поставщики данных дают уже скомпилированные подборки, но у них есть несколько недостатков. Например, в них могут отсутствовать необходимые или желаемые значения, которые повысили бы ценность аналитики на основе этих данных для компании, но у вас не будет возможности собирать или дополнять их. Данные, собранные сторонними агрегаторами, удобны для архивации и хранения, также они значительно экономят время и человеческий ресурс. Но если есть возможность собирать сырые данные, то лучше выбрать их — они более полные, и вы сможете самостоятельно агрегировать их в соответствии со своими потребностями и запросами бизнеса, а после работать с ними так, как вам потребуется. Многие компании самостоятельно собирают данные, а также использует доступные в открытых источниках. Но в некоторых случаях они вынуждены заплатить за получение необходимых данных третьей стороне. Иногда выбор мест приобретения данных может быть ограничен, в других случаях нет, но независимо от этого при выборе источника данных и принятии решения о их приобретении следует обратить внимание на несколько факторов:

Цена

Все любят бесплатные данные — и руководство и аналитики, но иногда высококачественная информация доступна только за деньги. В таком случае следует взвесить рациональность приобретения и сравнить стоимость и ценность данных.

Качество

Данные чисты, им можно доверять?

Эксклюзивность

Данные подготовлены индивидуально для вас или доступны всем желающим? Вы получите преимущество перед конкурентами, если будете использовать их?

Выборка

Есть возможность получить выборку для оценки качества данных до приобретения?

Обновления

Какой срок жизни данных, как быстро они устаревают, будут ли они обновляться и как часто?

Надежность

Какие ограничения у интерфейсов получения данных, какие еще ограничения могут накладываться на вас?

Безопасность

Если данные важны, то будут ли они зашифрованы и насколько надежными протоколами? Также не стоит забывать о безопасности при их передаче.

Условия использования

Лицензирование или иные ограничения. Что может не позволить вам воспользоваться данными в полном объеме?

Формат

Насколько вам удобно работать с форматом приобретаемых данных? Есть ли возможность их интеграции в вашу систему?

Документация

Если вам предоставляют документацию — хорошо, а если нет, то стоит поинтересоваться способом сбора данных для оценки их ценности и надежности.

Объем

Если данных много, вы сможете обеспечить их хранение и обработку? Ценные данные не всегда будут объемные, как и наоборот.

Степень детализации

Эти данные подходят для уровня необходимой вам аналитики? Это далеко не все, но основные и несомненно важные вопросы, которыми стоит  задаться перед приобретением данных у поставщиков. На этом я закончу статью по сбору данных. Если информация была для вас полезна, то я буду рад обратной связи. Возможно, вы с чем-то не согласны или хотите поделиться своими методами и наработками — приглашаю в комментарии, и надеюсь на увлекательное и полезное обсуждение. Всем спасибо за внимание и хорошего дня! Источник информации Карл Андерсон Аналитическая культура. От сбора данных до бизнес-результатов Creating a Data-Driven Organization ISBN: 978-5-00100-781-4 Издательство: Манн, Иванов и Фербер

  • аналитика
  • сбор данных
  • big data

Источник: https://habr.com/post/407977/

Books-med
Добавить комментарий