如何收集數據(6種數據收集方法)
編輯導讀:隨著“數字智能”時代的到來,數據在我們生活的方方面面都是不可或缺的,你真的了解數據嗎?本文將為您重新解讀數據的概念和價值,以及在“數字智能”時代,數據的價值是如何一步步被應用和升華的;因為內容很多,作者分幾期給大家講解。
(資料圖)
在上一篇文章中,我們了解到“數據”是一個龐大的系統(如下圖所示)。本文對數據進行了透徹的解釋(1):數據來源;以菜市場為例說明數據源的含義。今天,陳驍主要告訴我們到達指定的“菜市場”后如何“買菜”,也就是數據采集的過程。
首先簡單分類介紹一下數據采集的方法,然后介紹每種數據采集形式需要注意的點。
線下(問卷、實地調研)——要點:遵循五要素!
5個要素:
1)聚焦研究主題和目的。
評價問卷調查質量的一個最重要的標準就是問卷的內容是否符合研究主題,即使問卷設計精美,如果與主題無關,也毫無價值,因為進行問卷調查的本質目的是調查相關要素與研究群體之間密不可分的聯系。
例如,調查用戶滿意度一般涉及兩個維度:產品本身(價格、包裝等)。)和受眾的特點(年齡、地域、心理滿意度等。).
2)標題易讀、易懂、概括。
問卷發放后,需要觀眾填寫,所以問卷的可理解性也最終決定了問卷的質量。
問卷不是學術論文,也不需要涉及很多專業的、晦澀的詞匯才能體現專業性。調查人員能否真正理解是關鍵。
而概括性是指這個問題的設置是否對所有受眾都具有普遍意義。比如在調查居民出行方式的問卷中,你認為最安全的交通工具是A火車、B飛機、C寶馬汽車、D電動車。我們可以看到,選項C沒有普遍意義,也不是有A、B、d的維度選項。
3)充分考慮受訪者的特點。
在使用問卷調查法時,要充分結合轉崗群體的特點來設置問卷;例如,對于學齡前兒童和老年人,采取書面問卷的形式是不合適的。我們要充分考慮他們的語言偏好(有些老年人可能普通話不標準但方言流利)和理解內容的能力,然后派采訪和研究小組進行研究。
4)充分考慮問題排序(循序漸進)
問卷的設置除了考慮每個問題的規范性和合理性外,還需要考慮問題之間的邏輯性和連貫性,避免在時間、空、人物等維度上頻繁跳躍。
5)充分考慮統計的便利性。
除了考慮問卷調查的受眾,問卷設置還需要充分考慮后期問卷回收后的統計分析;盡量減少下班后的壓力。不應設置太多變量。我們應該使用盡可能少的變量來有效地獲取標簽信息,并幫助研究后的定性分析。
在線(按數據采集端口分為APP端和web端)
APP端(主機)-數據埋點獲取相關數據:
首先和大家聊聊科普。數據埋點是什么?以及為什么APP端要特別注意數據埋點。
所謂埋點,其實就是收集用戶在使用APP優化產品和運營過程中的一系列行為數據;然而,大多數應用程序都有自己的服務和盈利能力(如淘寶、Get等)。),所以要想實現轉化和引導購買,就需要在具體的交互組件中埋下“點”(例如,點擊跳轉鏈接、購買按鈕等)。),然后分析PV、UV;停留時間、跳出率、購買率等指標均量化。
就埋點的形式而言,主要分為以下三種類型:
代碼嵌入點:當控制操作發生時,數據通過預寫代碼發送。目前,百度統計和優盟提供這項服務。
這里有一個例子。比如我們要統計淘寶APP中“添加購物車”按鈕的點擊次數,點擊時可以調用該按鈕對應的OnClick函數中SDK提供的數據發送接口發送數據。
優點:控制數據發送時間,詳細記錄事件自定義屬性;缺點:時間和人力成本高,數據傳輸不及時。
可視化埋點:利用可視化交互手段,通過可視化界面配置控制操作與事件操作的關系,通過后臺截屏采集數據;比如在用戶多次刷新時,結合大數據算法,計算用戶偏好并切換推送的內容和產品,然后通過視覺嵌入自動切換對應的個性化推薦內容頁面。
優點:成本低,速度快,有產品、市場等部門參與;缺點:行為記錄信息少,支持的分析方法少,開發負擔小。
無埋點:用戶顯示UI界面元素時,平臺會通過控件綁定觸發事件,當事件被觸發時,系統會有相應的接口供開發者處理這些行為;上傳UI界面后,系統可以自動識別生成控件的唯一ID,該ID在程序內部生成。只要這些id在不同手機上相同,就可以實現無埋點的用戶端數據采集。
優點:無需埋點,方便快捷;缺點:行為記錄信息少,傳播壓力大。
網站-網絡爬蟲(python,C…):
就具體語法而言,由于使用的工具不同,無法對具體語法提供指導(大家根據自己的語言搜索CSDN),但其整體方法論是一致的。
方法學:手動確定抓取信息維度→分析目標網站URL構成→確認抓取工具→編寫編程語言→獲取數據→本地保存→跟進數據挖掘。
本期,筆者通過一個“買菜”的例子,帶大家了解了幾種數據收集的方式,相信大家都有收獲!
下期,筆者將基于數據收集,講解如何使用常用工具進行數據清理以及數據清理的幾個維度!
[email protected]??是產品經理,未經作者允許禁止轉載。
圖片來自Unsplash,基于CC0協議。
責任編輯:Rex_21