SlideShare une entreprise Scribd logo
1  sur  12
Télécharger pour lire hors ligne
用户研究中的数据分析
BigdatainUserResearch
张勇
用户研究与数据分析
项目周期中的定量用户研究方法
1. 定量:从数据中发现问题(某种模式存在)
2. 定性:了解为什么会这样,方案探索
3. 定量:测试评估方案效果
2/12
常见定量研究方法
短平快的定量研究:快速问卷(传统/电话/在线)
常用市场和用户研究定量模型和多元统计分析方法
·
·
PCA
因子分析
Conjoint
聚类等
-
-
-
-
3/12
基本使用情况和态度反馈(Usage and Attitude)
价值点:重要程度,得分(替代品/竞争对手)
-> 细分用户群比较 -> Kano
概念和态度测试
·
·
品牌形象测试-
4/12
功能偏好测试·
客户满意度/忠诚度和离开原因-
5/12
开源免费的数据挖掘和机器学习工具
R:r-project.org
Python:scikit-learn
Java: Apache Mahout™, WEKA: Online Class open for registration Sept. 9th
·
·
·
biplot(prcomp(USArrests,scale=TRUE),col=c("gray","black"))
6/12
数据可视化工具
图形处理库 R: ggplot2, Python: matplotlib·
plot(hclust(dist(as.matrix(mtcars))))
7/12
在线数据可视化工具 Google Charts等
基于Web的数据可视化库 Javascript: D3等
Dc.js Demo rCharts Example
商业软件 Tableau等
·
library('googleVis')
demo(WorldBank)
·
·
8/12
可重建的数据分析报告
nbviewer
RMarkdown, Knitr和Slidify·
library('slidify')
slidify('index.Rmd')
#本文档生成方式
publish(user="USER",repo="REPO")##Github
publish(dirname,host="dropbox")##Dropbox
publish(title='mytitle','index.html',host='rpubs')##Rpubs
iPython notebook·
$ipythonnotebook--pylab=inline
9/12
数据分析Web app
从rApache到OpenCPU
Markdown App
Rstudio和Shiny
Marketing Analysis App
·
·
library('shiny')
shiny::runGitHub('radyant','mostly-harmless',subdir='inst/marketing')
10/12
大数据的误解
推荐:Data Science, Data Analysis, Machine Learning @ Coursera
样本和全体数据
相关和因果关系
例:数据发现相关:荷尔蒙替代疗法 <-> 更低的心脏病
但实际上:荷尔蒙替代疗法会增加心脏病发病率
原因:荷尔蒙替代疗法(贵) <- 更高端人群 -> 更低的心脏病
日常分析的大数据有多大
·
·
放弃对因果关系的渴求,取而代之关注相关关系。只要知道“是什么”,而不需要知道“为什么”
《大数据时代》译者周涛:放弃对因果关系的分析是人类的堕落
-
-
·
Median job input sizes under 14 GB (at Microsoft and Yahoo)
90% of jobs on a Facebook cluster have input sizes under 100 GB.
-
-
11/12
大数据的处理方法
Linux命令:sort/cut/paste/awk (在windows上:Gow - The lightweight alternative to Cygwin)·
$tail-10000access_log|awk'{print$1}'|sort|uniq-c|sort-n|tail
$awk-F',''{x+=$1}END{printx}'test.csv
$awk-F","'$3~/^9/'customers.csv>customers_9_CA_zip_codes.csv
C:>ipconfig^|grepIPv4^|gawk-F:"{print$2}"^|gawk-F."{print($1)+($2*256)+($3*256*256)+($4*256*256
并行计算和GPU计算:R: foreach+doMC/doSNOW; Python: StarCluster
内存缓存和内存数据库:VoltDB, 试试Excel, sqlite on Ramdisk
列存储数据库: Monetdb
Map Reduce和Hadoop云计算
GraphLab and Vowpal Wabbit:
·
·
·
·
Mdrill阿里妈妈海量数据分布式在线分析查询系统
Javascript,R,和Python也可以玩Map Reduce Demo
Amazon EMR Pig Latin Demo
-
-
-
·
12/12

Contenu connexe

En vedette

在线卡片分类测试和数据分析工具分享
在线卡片分类测试和数据分析工具分享在线卡片分类测试和数据分析工具分享
在线卡片分类测试和数据分析工具分享Yong Zhang
 
Oracle面市笔记
Oracle面市笔记Oracle面市笔记
Oracle面市笔记yiditushe
 
Sql常见面试题
Sql常见面试题Sql常见面试题
Sql常见面试题yiditushe
 
Oracle数据库分析函数详解
Oracle数据库分析函数详解Oracle数据库分析函数详解
Oracle数据库分析函数详解mysqlops
 
The simplethebeautiful
The simplethebeautifulThe simplethebeautiful
The simplethebeautifulmysqlops
 
The Joys of Clean Data with Matt Dowle
The Joys of Clean Data with Matt DowleThe Joys of Clean Data with Matt Dowle
The Joys of Clean Data with Matt DowleSri Ambati
 
面试常见问题
面试常见问题面试常见问题
面试常见问题thao dinh
 
数据挖掘竞赛经验分享 严强
数据挖掘竞赛经验分享 严强数据挖掘竞赛经验分享 严强
数据挖掘竞赛经验分享 严强Felicia Wenyi Fei
 
网站分析及数据推动设计决策分享- Smartdesign Shanghai Taylor
网站分析及数据推动设计决策分享- Smartdesign Shanghai Taylor网站分析及数据推动设计决策分享- Smartdesign Shanghai Taylor
网站分析及数据推动设计决策分享- Smartdesign Shanghai TaylorTaylor Zhao
 
Market Timing, Big Data, and Machine Learning by Xiao Qiao at QuantCon 2016
Market Timing, Big Data, and Machine Learning by Xiao Qiao at QuantCon 2016Market Timing, Big Data, and Machine Learning by Xiao Qiao at QuantCon 2016
Market Timing, Big Data, and Machine Learning by Xiao Qiao at QuantCon 2016Quantopian
 
Big Data Alchemy: How can Banks Maximize the Value of their Customer Data?
Big Data Alchemy: How can Banks Maximize the Value of their Customer Data?Big Data Alchemy: How can Banks Maximize the Value of their Customer Data?
Big Data Alchemy: How can Banks Maximize the Value of their Customer Data?Capgemini
 
Working With Big Data
Working With Big DataWorking With Big Data
Working With Big DataSeth Familian
 
Visual Design with Data
Visual Design with DataVisual Design with Data
Visual Design with DataSeth Familian
 

En vedette (14)

在线卡片分类测试和数据分析工具分享
在线卡片分类测试和数据分析工具分享在线卡片分类测试和数据分析工具分享
在线卡片分类测试和数据分析工具分享
 
Oracle面市笔记
Oracle面市笔记Oracle面市笔记
Oracle面市笔记
 
Sql常见面试题
Sql常见面试题Sql常见面试题
Sql常见面试题
 
Banking Big Data Analytics
Banking Big Data AnalyticsBanking Big Data Analytics
Banking Big Data Analytics
 
Oracle数据库分析函数详解
Oracle数据库分析函数详解Oracle数据库分析函数详解
Oracle数据库分析函数详解
 
The simplethebeautiful
The simplethebeautifulThe simplethebeautiful
The simplethebeautiful
 
The Joys of Clean Data with Matt Dowle
The Joys of Clean Data with Matt DowleThe Joys of Clean Data with Matt Dowle
The Joys of Clean Data with Matt Dowle
 
面试常见问题
面试常见问题面试常见问题
面试常见问题
 
数据挖掘竞赛经验分享 严强
数据挖掘竞赛经验分享 严强数据挖掘竞赛经验分享 严强
数据挖掘竞赛经验分享 严强
 
网站分析及数据推动设计决策分享- Smartdesign Shanghai Taylor
网站分析及数据推动设计决策分享- Smartdesign Shanghai Taylor网站分析及数据推动设计决策分享- Smartdesign Shanghai Taylor
网站分析及数据推动设计决策分享- Smartdesign Shanghai Taylor
 
Market Timing, Big Data, and Machine Learning by Xiao Qiao at QuantCon 2016
Market Timing, Big Data, and Machine Learning by Xiao Qiao at QuantCon 2016Market Timing, Big Data, and Machine Learning by Xiao Qiao at QuantCon 2016
Market Timing, Big Data, and Machine Learning by Xiao Qiao at QuantCon 2016
 
Big Data Alchemy: How can Banks Maximize the Value of their Customer Data?
Big Data Alchemy: How can Banks Maximize the Value of their Customer Data?Big Data Alchemy: How can Banks Maximize the Value of their Customer Data?
Big Data Alchemy: How can Banks Maximize the Value of their Customer Data?
 
Working With Big Data
Working With Big DataWorking With Big Data
Working With Big Data
 
Visual Design with Data
Visual Design with DataVisual Design with Data
Visual Design with Data
 

Similaire à 用户研究中的数据分析

RMPG 讀書會 20160107
RMPG 讀書會 20160107RMPG 讀書會 20160107
RMPG 讀書會 20160107moris lee
 
BABOKv3 讀書會 20160331
BABOKv3 讀書會 20160331BABOKv3 讀書會 20160331
BABOKv3 讀書會 20160331moris lee
 
CBAP 技術交流 20151105
CBAP 技術交流 20151105CBAP 技術交流 20151105
CBAP 技術交流 20151105moris lee
 
Benchmarking3
Benchmarking3Benchmarking3
Benchmarking35045033
 
QM-003-6 sigma
QM-003-6 sigmaQM-003-6 sigma
QM-003-6 sigmahandbook
 
BABOKv3 讀書會 20160324
BABOKv3 讀書會 20160324BABOKv3 讀書會 20160324
BABOKv3 讀書會 20160324moris lee
 
软件工程 第三章
软件工程 第三章软件工程 第三章
软件工程 第三章浒 刘
 
重新認識田口方法
重新認識田口方法重新認識田口方法
重新認識田口方法Arthur Su
 
重新認識田口方法
重新認識田口方法重新認識田口方法
重新認識田口方法Arthur Su
 
基于数据挖掘的客户流失预测实证研究
基于数据挖掘的客户流失预测实证研究基于数据挖掘的客户流失预测实证研究
基于数据挖掘的客户流失预测实证研究学峰 司
 
Listing_Detail篇__android客户端设计研究系列.pptx
Listing_Detail篇__android客户端设计研究系列.pptxListing_Detail篇__android客户端设计研究系列.pptx
Listing_Detail篇__android客户端设计研究系列.pptxetaoux
 
問題分析與解決方法介紹
問題分析與解決方法介紹問題分析與解決方法介紹
問題分析與解決方法介紹joe lo
 

Similaire à 用户研究中的数据分析 (20)

RMPG 讀書會 20160107
RMPG 讀書會 20160107RMPG 讀書會 20160107
RMPG 讀書會 20160107
 
香港六合彩
香港六合彩香港六合彩
香港六合彩
 
香港六合彩
香港六合彩香港六合彩
香港六合彩
 
香港六合彩
香港六合彩香港六合彩
香港六合彩
 
香港六合彩 &raquo; SlideShare
香港六合彩 &raquo; SlideShare香港六合彩 &raquo; SlideShare
香港六合彩 &raquo; SlideShare
 
BABOKv3 讀書會 20160331
BABOKv3 讀書會 20160331BABOKv3 讀書會 20160331
BABOKv3 讀書會 20160331
 
CBAP 技術交流 20151105
CBAP 技術交流 20151105CBAP 技術交流 20151105
CBAP 技術交流 20151105
 
Benchmarking3
Benchmarking3Benchmarking3
Benchmarking3
 
QM-003-6 sigma
QM-003-6 sigmaQM-003-6 sigma
QM-003-6 sigma
 
国外电信市场标杆研究
国外电信市场标杆研究国外电信市场标杆研究
国外电信市场标杆研究
 
1 Dmaic D
1 Dmaic D1 Dmaic D
1 Dmaic D
 
BABOKv3 讀書會 20160324
BABOKv3 讀書會 20160324BABOKv3 讀書會 20160324
BABOKv3 讀書會 20160324
 
软件工程 第三章
软件工程 第三章软件工程 第三章
软件工程 第三章
 
淺談品質指標及決策實驗室分析方法介紹
淺談品質指標及決策實驗室分析方法介紹淺談品質指標及決策實驗室分析方法介紹
淺談品質指標及決策實驗室分析方法介紹
 
重新認識田口方法
重新認識田口方法重新認識田口方法
重新認識田口方法
 
重新認識田口方法
重新認識田口方法重新認識田口方法
重新認識田口方法
 
手搖飲 市場情報監測架構
手搖飲 市場情報監測架構手搖飲 市場情報監測架構
手搖飲 市場情報監測架構
 
基于数据挖掘的客户流失预测实证研究
基于数据挖掘的客户流失预测实证研究基于数据挖掘的客户流失预测实证研究
基于数据挖掘的客户流失预测实证研究
 
Listing_Detail篇__android客户端设计研究系列.pptx
Listing_Detail篇__android客户端设计研究系列.pptxListing_Detail篇__android客户端设计研究系列.pptx
Listing_Detail篇__android客户端设计研究系列.pptx
 
問題分析與解決方法介紹
問題分析與解決方法介紹問題分析與解決方法介紹
問題分析與解決方法介紹
 

用户研究中的数据分析