SlideShare une entreprise Scribd logo
1  sur  84
Télécharger pour lire hors ligne
PHÂN TÍCH DỮ LIỆU
Xử lý dữ liệu


      Phân tích đơn biến


      Phân tích nhị biến


Tổng quan về phân tích đa biến
Xử lý dữ liệu


      Phân tích đơn biến


      Phân tích nhị biến


Tổng quan về phân tích đa biến
Hiệu chỉnh (Editing)

 Mã hoá (Coding)

Tạo tập tin dữ liệu
Mục đích

  Đúng thủ tục/đối tượng phỏng vấn (legibility)

  Xử lý các phỏng vấn/trả lời không hoàn chỉnh
  (completeness)

  Tính nhất quán của các trả lời (consistency)

  Sự chính xác của các trả lời (accuracy)

  Sự rõ ràng của các trả lời (clarification)
Quá trình

Hiệu chỉnh sơ bộ (field editing):

•   Thực hiện bởi interviewer
•   Càng sớm càng tốt sau khi phỏng vấn xong
Hiệu chỉnh cuối cùng (office editing):

•   Thực hiện bởi editor
•   Sau khi thu thập xong data
•   Đòi hỏi người hiệu chỉnh phải có nhiều kinh nghiệm,
    kiến thức.
Xử lý khi phát hiện lỗi
   Liên lạc trở lại để bổ sung hoặc làm rõ
   Hiệu chỉnh, làm rõ hoặc bổ sung theo trí nhớ
   hoặc các cứ liệu/suy luận khác
   Hủy bỏ một số câu trả lời (missing value)
   Hủy hoàn toàn cuộc phỏng vấn/questionnaire
Là quá trình gán mã số (số hoặc nhãn) cho các biến
và các trả lời.




Thang đo của biến tùy thuộc vào cách hỏi và bản chất
của biến được hỏi.
Các bước mã hoá
◦ Đặt tên biến cho các câu hỏi
   Câu hỏi 1 chọn lựa
   Câu hỏi nhiều chọn lựa
◦ Chuyển tập các chọn lựa trả lời của mỗi câu hỏi thành
  tập các số/nhãn phù hợp, có ý nghĩa.
   Câu hỏi đóng
   Câu hỏi mở
   Câu hỏi có chọn lựa: “Khác”
   Hai trường hợp “Không biết”
Tính phù hợp          Tính toàn diện
 (appropriateness)     (exhaustiveness)

                 NGUYÊN
                   TẮC

Tính loại trừ nhau     Tính đơn nguyên
(mutual exclusivity)   (unidimensionality)
Tính phù hợp
    (appropriateness)



Thí dụ: Thông tin cá nhân   Cách phân loại/ nhóm
hoặc doanh nghiệp.          phải phù hợp với vấn
Tuổi <18 18-30 …. ?         đề/ mục tiêu nghiên
     <16 16-25 …. ?         cứu.
Tính toàn diện
                                (exhaustiveness)



   Các mã số cần thể         Thí dụ: Tuổi    <18
hiện các loại cần NC.                        18-30
   Loại “trả lời khác” nên                   >30
chiếm tỉ lệ nhỏ nhất.                        ??
Mỗi trả lời chỉ tương
                         ứng với một mã số.




                       Thí dụ: quốc doanh, tư
Tính loại trừ nhau
                       nhân, TNHH, cổ phần ??
(mutual exclusivity)
Mỗi câu trả lời ứng với
một thứ nguyên duy
nhất.




                          Tính đơn nguyên
                          (unidimensionality)
Nhập dữ liệu vào file (SPSS)

Cải biến tập dữ liệu

Tạo biến mới, biến trung gian, v.v.

Xử lý missing value


             Thí dụ về data file
Xử lý dữ liệu


     Phân tích đơn biến


      Phân tích nhị biến


Tổng quan về phân tích đa biến
Tổng quan về phân tích dữ liệu


Tổng quát về phân tích đơn biến


Thống kê mô tả


Kiểm nghiệm giả thuyết đơn biến
Chọn phương pháp phân tích đơn biến nào?

Tùy vào:
   Có bao nhiêu biến được phân tích đồng
   thời?
   Mục tiêu phân tích chỉ là mô tả mẫu hay suy
   đoán cho tổng thể
   Các biến được đo bởi thang đo gì? Chỉ
   danh, thứ tự, khoảng, tỉ lệ.
Start



              Bao nhiêu biến
              được phân tích
                đồng thời
1 biến                              Trên 2 biến
                      2 biến

  Phân tích     Phân tích      Phân tích
  đơn biến       nhị biến       đa biến
Phân tích đơn biến



               Khoảng        Thang đo         Chỉ danh
                             của biến

                                   Thứ tự

MÔ TẢ                         Trung vị
        Trung bình                               Yếu vị
                              Khoảng/
        Phương sai                              Tần suất
                             phần trăm

 SUY
ĐOÁN                        Kolmogorov
                                              Chi – square
        Z test/ t test       – Smirnov
                                                  test
                                test
Biến chỉ danh, thứ tự
                                           Ví dụ
 Response    Frequency   Percentage      Cum.
 Category                             Percentage
 Benthanh         1          -             -
  Foster          3          1             1
  Saigon         45         18            19
 Heineken       120         46           65
   Tiger         92         35           100
                261        100%
Lợi ích của biến chỉ danh, thứ tự:
   Trình bày phân phối dữ liệu của một biến có
   thang đo nominal hoặc ordinal.
   Phát hiện một số dạng sai sót khi mã hoá.
   So sánh với các phân phối/ dữ liệu có liên quan.
   Đề nghị những phương pháp biến đổi các biến
   Kiểm tra sampling.
Biến khoảng
            N                       215
        Minimum                           1
        Maximum                           5
          Mean         Statistic      2.25
                       Std. Error     0.06
      Std. Deviation   Statistic      0.83
                       Statistic      0.57
       Skewness
                       Std. Error     0.17
                       Statistic      0.45
        Kurtosis
                       Std. Error     0.33
                                    Ví dụ
Kiểm chứng xem những phát biểu nào đó có
thích hợp cho tổng thể nghiên cứu hay không.
• TD: Bình quân tuổi của 100 SV trong mẫu là Ā =
  24 (s=5). Nhà NC muốn kiểm chứng cho tổng thể:
  • Null hypothesis        Ho: µ = 23
  • Alternative hypothesis H1: µ ≠ 23

Các phân tích liên quan đến kiểm nghiệm giả
thuyết gọi là phân tích suy luận (inferential
analysis).
• Thiết lập giả thuyết H0 và H1
B1
     • Xác định phương pháp test phù hợp (statistical test).
B2
     • Chọn trước mức ý nghĩa α (significance level)
B3
     • Tính (tra bảng) giá trị test tới hạn (critical value) ứng với
       α (one/ two tailed)
B4
     • Tính giá trị kiểm nghiệm thống kê từ tập số liệu
B5
     • Nếu giá trị tính được ở B5 lớn hơn giá trị tới hạn
       loại Ho
B6
Biến đo bằng thang khoảng (interval)
     ◦ Có thể dùng t Test hoặc Z Test để test giá trị trung bình
       của tổng thể khi biết giá trị trung bình của mẫu
         Z TEST                              t TEST
   Biết phương sai σ của tổng    Không biết phương sai σ của
thể và cỡ mẫu bất kỳ.         tổng thể và cỡ mẫu bất kỳ.
   Không biết phương sai σ      Khi cỡ mẫu n > 30 thì phân
của tổng thể và cỡ mẫu n >30 phối t = phân phối z
                                  Lưu ý: khi tra bảng tc thì
                               dF = n-1     x−μ
                                            t=
                                                  Sx
Thí dụ (tiếp theo thí dụ trên)
Bình quân tuổi của 100 SV trong mẫu là Ā = 24 (s=5). Nhà NC
muốn kiểm chứng cho tổng thể:
    Null hypothesis              Ho: µ = 23
    Alternative hypothesis       H1: µ ≠ 23
   Do n = 100 > 30 nên dùng Z test
   Chọn mức ý nghĩa α = 0.05 (two tailed)          Zc = 1.96
   Tính Z khi chưa biết σ : Z = (Ā - µ) n1/2/s
                                 = (24 - 23) x 1001/2/5 = 2
   Z = 2 > Zc = 1.96       loại Ho
     Không thể kết luận (với significant 5%) là µ = 23
  Lưu ý: Nếu biến tỉ lệ thì Z = (p - π)/ (pq/ n)1/2
Biến đo bằng thang thứ tự (ordinal)
◦   Dùng chi-square test để so sánh phân phối các loại
    (categories) của mẫu và kỳ vọng của tổng thể


                Các bước tiến hành
B2. Xác định mức
B1. Phát biểu giả                                  B3. Tra bảng Chi-
                          ý nghĩa α và bậc                        χ c2
thuyết H0, H1                                      Square chuẩn
                          tự do df
                        df = k – 1 (k là số loại
                        danh định có thể chọn
                        trong biến thứ tự)
                                      B5. Bác bỏ/chấp nhận
    B4. Tính giá trị kiểm             H0 dựa trên tiêu chuẩn
    nghiệm theo công thức             “Bác bỏ H0- nếu (tính
                                      được) > (tới hạn)”.
         k
               ( O i − E i ) 2 Oi: Số lần xuất hiện loại i trong mẫu
 χ2 =   ∑
        i =1         Ei        Ei: Giá trị kỳ vọng của số lần xuất hiện
Biến đo bằng thang thứ tự (ordinal)
◦   Dùng chi-square test để so sánh phân phối các loại
    (categories) của mẫu và kỳ vọng của tổng thể


                Các bước tiến hành

◦   Nghĩa là có sự khác biệt giữa phân phối của mẫu và
    phân phối của tổng thể.
◦   Kiểm định Chi-Square không có ý nghĩa khi số lần
    xuất hiện kỳ vọng cho mỗi lựa chọn < 5.
Thí dụ: Khảo sát 100 người đang sử dụng
     internet ở HCMC

Nghề nghiệp    Oi    Ei    Oi - Ei       (Oi - Ei)2   (Oi - Ei)2/ Ei
Lao động        15    25        -10            100          4
Nhân viên VP    20    25         -5             25          1
Quản lý         30    25             5          25          1
Sinh viên       35    25         10            100         4
Total          100   100                              χ 2 =10
Thí dụ: Khảo sát 100 người đang sử dụng
internet ở HCMC (n = 100)
Cột 1: Phân bố nghề nghiệp của những người sử
dụng internet.
Cột 2: Phân bố kỳ vọng (bằng nhau cho các nhóm)
Ho: Không có sự khác nhau về nghề nghiệp của
những người sử dụng internet
K = 4 loại nghề nghiệp       Df = k - 1 = 3
χ c = 6.25 ( với α = 10%)
  2


Vì  χ 2 = 10 > χ c2 = 6.25 loại bỏ H0
Xử lý dữ liệu


      Phân tích đơn biến


     Phân tích nhị biến


Tổng quan về phân tích đa biến
Bảng 2 chiều (Two – way Tabulation)
 Khảo sát mức độ và các mối liên hệ (có thể có)
 giữa các cặp biến.
 Thích hợp cho các trường hợp số loại trong mỗi
 biến không lớn, thang đo nominal hoặc ordinal.
 Chỉ định hướng, không kết luận về mối quan hệ
 nhân quả giữa các biến.
 Kết quả có thể bị lệch nếu các ô có giá trị nhỏ.
Function group             Total

                                      Mkt &
                                                  Prodct       Others
                                      Sales

                   Count                  41           62           41      144

            Male   % within Gender     28.5%        43.1%       28.5%    100.0%
                   % within Functgr    74.5%        93.9%       53.2%     72.7%
Gender




                   % of Total          20.7%        31.3%       20.7%     72.7%
                   Count                  14               4        36           54

          Female % within Gender       25.9%         7.4%       66.7%    100.0%
                   % within Functgr    25.5%         6.1%       46.8%     27.3%
                   % of Total           7.1%         2.0%       18.2%     27.3%
                   Count                  55           66           77      198
                   % within Gender     27.8%        33.3%       38.9%    100.0%
         Total     % within Functgr   100.0%      100.0%       100.0%    100.0%
                   % of Total          27.8%        33.3%       38.9%    100.0%
Phương pháp         Áp dụng                 Minh họa
Chi – Square                        Quan hệ giữa thu nhập
               Quan hệ giữa 2 biến
Contingency                         (hoặc nghề nghiệp) với
                     chỉ danh.
    Test                            việc chọn nhãn hiệu bia.
   Hệ số                            Quan hệ giữa mức thưởng
               Quan hệ giữa 2 biến nhân viên bán hàng (mức
tương quan
                      thứ tự.       1, 2, 3, 4) và thành tích
 Spearman                           (mức 1, 2, 3, 4, 5).
   Hệ số       Quan hệ giữa 2 biến Quan hệ giữa tuổi của
tương quan             metric       khách hàng và chi phí hàng
  Pearson       (khoảng hay tỉ lệ). tháng cho y tế.
                   Xây dựng một
 Hồi quy       hàm tuyến tính giữa Doanh thu (đồng) theo chi
 đơn giản          2 biến metric    phí khuyến mãi.
                 (phụ thuộc nhau)
Chi – Square contingency test
 Mục đích:
   Xác định sự tồn tại mối quan hệ giữa 2 biến danh
   định.
 Yêu cầu:
   Không có ô nào có số lần xuất hiện kỳ vọng < 1
   Không quá 1/5 tổng số ô có số lần xuất hiện < 5
 Hạn chế:
   Chỉ xác định có quan hệ hay không, không cho
   biết mức độ quan hệ.
Hệ số Contingency thường được bổ sung vào kiểm
nghiệm Chi-Square để biết mức độ quan hệ giữa 2 biến.

          χ   2
                    C = 0: không có quan hệ
  c=
        n+ χ2       C không có chặn trên      khó diễn dịch


Nên trong thực tế hay dùng hệ số thống kê Cramer

           χ2       V = 0: không có quan hệ
   v=
        n( f − 1)   V = 1: có quan hệ hoàn hảo
Thí dụ: Kết quả khảo sát nhãn hiệu Bia ưa thích
  nhất phân theo mức thu nhập.
              Nhãn hiệu bia ưa thích nhất
Thu nhập                                          Tổng
             Bia A       Bia B       Bia C
                   50        200         125
  Thấp                                               375
             (109.38)    (101.56)    (164.06)
                 200         100         350
Trung bình                                           650
             (189.58)    (176.04)    (284.38)
                 100           25           50
   Cao                                               175
              (51.04)     (47.40)      (76.56)
  Tổng           350         325            525     1200
Ghi chú: Con số trong ngoặc chỉ giá trị kỳ vọng của mỗi ô
trong bảng. Chúng được xác định theo tỉ lệ với tổng về thu
nhập và loại bia ưa thích.
(Ô 1-1 có giá trị kỳ vọng = 350 x 375 / 1200 = 109.38)
                            k (O − E ) 2
Tính
                χ = ∑i =1 ∑
                  2    l          ij     ij

                           j =1      Eij
Kết quả :      χ = 252.2
                  2


               Df = (k-1)(l-1) = (3-1)(3-1) = 4
Nếu chọn α = 1% thì    χ C = 13.3 (tra bảng)
                         2

 χ 2 = 252.2 > χ C = 13.3
                  2
                                loại Ho
  Có sự khác biệt đáng kể giữa phân phối của mẫu và kỳ
vọng (tổng thể)
Hệ số tương quan Spearman và Pearson
 Spearman: tương quan giữa 2 biến thứ tự (ordinal)
 Pearson: tương quan giữa các biến khoảng/ tỉ lệ.
 Hệ số tương quan r = 0   1 (không kể dấu +/-)
          r > 0.8          rất mạnh
         r = 0.6 – 0.8     mạnh
         r = 0.4 – 0.6     có tương quan
         r = 0.2 – 0.4     tương quan yếu
         r < 0.2           không tương quan
Lưu ý:
 Hai biến phải có phân phối chuẩn nhị biến.
 Phương sai của 1 biến tại bất kỳ giá trị nào của
 biến kia cũng phải bằng nhau.
 Khi r nhỏ không có nghĩa là không tương quan, mà
 chỉ không tương quan tuyến tính.
 Khi |r| lớn chỉ cho thấy mối tương quan, nhưng
 không xác định quan hệ nhân quả.
Phân tích hồi quy tuyến tính đơn
◦    Phân tích 2 biến khoảng/ tỉ lệ: Hồi quy tuyến tính đơn
                         Y = aX + b
◦    Sự khác biệt giữa hồi quy và tương quan

    Hồi quy tuyến tính              Tương quan

       Tạo ra một phương             Phát hiện ra mức độ
       trình toán học liên kết       tương    quan  giữa
       các biến lại                  2 biến
       Tồn tại giả thiết nhân –
                                     Không có giả thiết về
       quả: Biến độc lập –
                                     nhân quả
       Biến phụ thuộc
Xử lý dữ liệu


      Phân tích đơn biến


       Phân tích nhị biến


Tổng quan về phân tích đa biến
Phân tích phụ thuộc
• Xác định được biến nào là phụ thuộc, biến nào là độc lập
• Bao gồm các phương pháp: phân tích hồi quy đa biến,
ANOVA, Conjoint, Discriminant, Canonical analysis...

Phân tích tương tác
• Không xác định trước biến nào là phụ thuộc, biến nào là
độc lập, chủ yếu là tìm kiếm các mô thức tương quan.
• Bao gồm các phương pháp: Factor analaysis, Cluster,
Multi-dimensional Scaling.
          Phân tích đa biến giúp giải quyết nhiều bài toán phức
          tạp. Tuy nhiên, mỗi phương pháp phân tích đa biến đều
          dựa trên một số giả thiết (ngầm)  cần thận trọng.
Các phương pháp phân tích phụ thuộc – Yêu cầu về thang đo

                                   Thang đo của biến
      Phương pháp
                                Phụ thuộc          Độc lập
Một biến phụ thuộc

        Hồi quy bội              Interval        Interval

          ANOVA                  Interval        Nominal

  Hồi quy bội - biến dummy       Interval        Nominal

    Discriminant analysis       Nominal          Interval

      Conjoint analysis          Ordinal         Nominal
Các phương pháp phân tích phụ thuộc – Yêu cầu về thang đo

                                   Thang đo của biến
      Phương pháp
                                Phụ thuộc          Độc lập

Hai biến phụ thuộc trở lên

     Canonical analysis          Interval        Interval

         MANOVA                  Interval        Nominal

Mạng lưới của nhiều biến phụ thuộc và độc lập

Structural Equation Modeling
                                 Interval        Interval
            (SEM)
HỒI QUY TUYẾN TÍNH BỘI
     y = a1X1 + a2X2 + a3X3 + ... anXn + b
Dạng mở rộng của hồi quy đơn.
Một biến phụ thuộc, nhiều biến độc lập.
Tất cả được đo bằng thang interval (ngoại lệ:
dummy-variable multiple regression)
Đánh giá mô hình và kết quả hồi quy theo 3 phần:
  Mức độ phù hợp của phương trình hồi quy:
     Dùng hệ số r2 (coefficient of determination)
     r2 = 0 ÷ 1    đặc trưng cho % của biến thiên trong
     biến phụ thuộc được giải thích do sự biến thiên của
     biến độc lập.
  Kiểm nghiệm mức ý nghĩa của r2:
     Dùng F – test, với độ tự do: df = n – k – 1 cho mẫu
     số và df = k cho tử số (n: cỡ mẫu, k: số biến độc lập)
  Kiểm nghiệm mức ý nghĩa của các độ dốc ai:
     Dùng t – test với độ tự do df = n – k – 1
 ◦
Kiểm nghiệm các giả thuyết của phương pháp hồi quy

   Linearity

   Đa cộng tuyến (Multicolinearity)

   Phân phối chuẩn (Normality) của sai số và mỗi biến

   Sai số hồi quy có variance không đổi

   Tính độc lập của các sai số hồi quy
Linearity


     Có mối quan hệ tuyến tính giữa biến phụ thuộc và
  các biến độc lập.

     Test: quan sát scatter diagram hoặc ma trận tương
  quan
Đa cộng tuyến (Multicolinearity)

    Giả thuyết: các biến độc lập không có tương quan tuyến
tính với nhau.
   Khi bị vi phạm  Có hiện tượng đa cộng tuyến, nghĩa là
hiện hữu mối tương quan tuyến tính giữa ≥ 2 biến độc lập.
   Đa cộng tuyến gây ra:
          Hạn chế giá trị r2
          Sai lệch/ đổi dấu các hệ số hồi quy
   Test đa cộng tuyến: hệ số Tolerance hoặc VIF
Một số lưu ý khi sử dụng multiple regression:
   Phân tích hồi quy tuyến tính chỉ có nghĩa khi có tương
quan TUYẾN TÍNH giữa các biến.
   r2 không nói lên được quan hệ nhân quả giữa các biến
   Có thể dự đoán sai nếu nằm ngoài khoản tính toán
   Để đảm bảo độ tin cậy phải có nhiều hơn 10 điểm cho mỗi
biến độc lập đưa vào phương trình ( yêu cầu cỡ mẫu)
   Khoảng dao động (range) các biến có thể ảnh hưởng đến ý
nghĩa phương trình hồi quy.
   Trường hợp biến độc lập là nominal thì có thể sử dụng
dummy-variable. Khi đó:
       Số biến dummy = k-1; với k = số loại của biến nominal
       Mỗi biến dummy chỉ nhận giá trị 0 hoặc 1
Thí dụ:
  Bài toán tìm các yếu tố quyết định sự thỏa mãn
  của nhân viên trong Cty XYZ.
     Biến phụ thuộc: sự thỏa mãn của nhân viên Cty.
     Biến độc lập: thu nhập, điều kiện làm việc, sự quan
  tâm của cấp trên, quan hệ với đồng nghiệp, cơ hội
  thăng tiến, cơ hội học tập, v.v..
Unstandardized




                                         Standardized
                  Coefficients




                                         Coefficients
                                                                       Collinearity
                                                                        Statistics
  Biến                   Std.
             B                           Beta
 độc lập                 Error                           t      Sig. Tolerance   VIF

(Constant)   .540                 .193                  2.793   .007
Thu nhập     .526                 .081    .596          6.491   .000       .793 1.262

   Sự
quan tâm/    .205                 .061    .310          3.380   .001       .793 1.262
công nhận

                                    r = 0.787            r2 = 0.619    F sig. = 0.000
ANOVA – ANALYSIS OF VARIANCE


Mục đích     Đặc điểm     Áp dụng
ANOVA – ANALYSIS OF VARIANCE


Mục đích     Đặc điểm     Áp dụng
ANOVA – ANALYSIS OF VARIANCE


Mục đích          Đặc điểm   Áp dụng


     Khảo sát mối quan hệ
     giữa các biến độc lập
         và phụ thuộc
ANOVA – ANALYSIS OF VARIANCE


Mục đích     Đặc điểm           Áp dụng


                Tương tự như phân tích hồi quy,
                   nhưng các biến độc lập là
               biến nonmetric (nominal/ ordinal)
ANOVA – ANALYSIS OF VARIANCE


     Mục đích             Đặc điểm             Áp dụng


So sánh giá trị trung bình của một thuộc tính (biến phụ
thuộc/ thang metric) thể hiện ảnh hưởng của một hay
 nhiều thuộc tính khác (biến độc lập/thang nonmetric)
ANOVA – ANALYSIS OF VARIANCE
   Nếu có nhiều biến độc lập với thang chỉ danh gọi là
Factorial ANOVA
   Nguyên tắc: Nếu có sự khác biệt đáng kể giữa các
nhóm thì “between-group variance > within-group variance”
    ANCOVA: có xét đến các ảnh hưởng của một hay
nhiều biến ngoại lai (gọi là control variable hoặc covariates
- thang đo metric) và sẽ loại ra khỏi tập biến phụ thuộc
trước khi phân tích ANOVA.
   MANOVA nếu có nhiều biến phụ thuộc
   MANCOVA có nhiều biến phụ thuộc và biến kiểm soát
Thí dụ:

  Khảo sát 200 doanh nghiệp thuộc 3 ngành May
  mặc, Mỹ phẩm và Nhựa gia dụng về chi phí
  dành cho khuyến mãi hằng năm.
  Mục đích phân tích nhằm tìm xem có sự khác
  nhau đáng kể/ có ý nghĩa thống kê giữa 3
  ngành này về chi phí khuyến mãi không?
Cty   Ngành     Chi phí KM
                                   (1000 USD)
Biến độc lập:       1      May             123
ngành (chỉ danh)    2      May             235
(3 treatments)      3    Mỹ phẩm          1346
                    4     Nhựa             876
Biến phụ thuộc:     .        .                .
chi phí khuyến      .        .                .
mãi (ratio)        199    Nhựa              68
                   200     May              12
Bài toán này có thể so sánh giá trị trung bình của
 chi phí khuyến mãi theo từng cặp ngành (dùng t –
 test). Tuy nhiên, khi số treatment lớn    số lượng
 so sánh sẽ rất lớn.

 Khi đó nên dùng ANOVA:
 ◦   H0 : μ1 = μ2 = ... = μk = μ
 ◦   Ha : có ít nhất 1 giá trị μi khác những giá trị kia.
Với μ là trung bình của tổng thể
DISCRIMINANT ANALYSIS


   Mục đích          Đặc điểm             Nguyên tắc

Nhận ra những      Biến độc lập có   Hàm phân biệt có dạng:
thuộc tính (các    thang metric,
biến độc lập) để                     Y = v1.X1 + v2.X2 + v3.X3 + …
                   biến phụ thuộc
phân biệt các      có        thang   Sau khi tính được Y, so
nhóm định trước    nonmetric.        sánh với giá trị chuẩn Yc
của biến phụ                         để biết đối tượng thuộc
thuộc                                nhóm nào.
Thí dụ:
  Công ty máy tính muốn biết xem thu nhập gia đình (X1)
  và số năm học ở trường của chủ hộ (X2) có phải là hữu
  ích trong việc phân biệt hộ có mua máy tính PC hay
  không. Khảo sát X1 và X2 của 2 nhóm mẫu ngẫu nhiên
  (có và không có PC).
 Biến độc lập:      X1 – thu nhập,
                    X2 – số năm học : metric
 Biến phụ thuộc: Có PC, Không có PC: category.
 Kết quả sẽ là hàm phân biệt: Y= v1X1 + v2X2
 v1, v2 : trọng số phân biệt (hằng số) Y: điểm phân biệt
 So sánh Yi và Yc
     Phần tử i sẽ thuộc nhóm nào trong 2 nhóm mẫu trên.
CONJOINT ANALYSIS


 Mục đích           Áp dụng
CONJOINT ANALYSIS


      Mục đích


Phân tích ảnh hưởng tổng hợp (joint effects) của 2 hay
nhiều biến độc lập (thang nominal) lên một biến phụ
thuộc (utility score - thang đo ordinal)
CONJOINT ANALYSIS


                                      Áp dụng


Thường dùng trong test sản phẩm với nhiều yếu tố khác
nhau (chất lượng, kiểu dáng, giá bán, nhãn hiệu, v.v.).
Mỗi yếu tố có vài phương án khác nhau. Tìm xem tổ
hợp nào được ưa thích nhất.
CONJOINT ANALYSIS – ÁP DỤNG
Nhà NC tạo ra một tập các phương án sản phẩm. Mỗi
phương án là 1 tổ hợp của các yếu tố.
Tập các phương án này được đưa cho đối tượng chọn/
xếp hạng (hoặc cho điểm thể hiện mức ưa thích).
Conjoint analysis sẽ đánh giá ảnh hưởng của các utility
score thành phần (hay part-worths, tượng trưng cho
mức độ quan trọng của mỗi yếu tố) lên sự ưa thích tổng
hợp (utility) đối với một sản phẩm.
CONJOINT ANALYSIS – ÁP DỤNG
Có thể dùng kết quả để


 Đánh giá thị phần của các nhãn hiệu trên thị trường



                Phân khúc thị trường


  Nhận dạng cơ hội thị trường cho một sản phẩm với
               tổ hợp thuộc tính mới
Thí dụ:
Thiết kế sản phẩm mới có 3 thuộc tính:
   Giá :          (cao, trung bình, thấp)
   Kiểu dáng :    (cao, trung bình, thấp)
   Chức năng :    (đơn giản, phức tạp) ...
   Chỉ cần đánh giá 1 nhóm khoảng 8 tổ hợp (thay vì
   18 tổ hợp) về tính hấp dẫn của sản phẩm đối với
   khách hàng.
Thí dụ:

                  Tầm quan trọng
                 của mỗi thuộc tính     Tạo ra sản
                                        phẩm có độ
                                        vị lợi cao
                                        nhất đối với
                   Tầm quan trọng       người mua.
Nhà nghiên cứu
                   của mỗi mức độ
                 trong các thuộc tính
Phân tích phụ thuộc




Phân tích tương tác
FACTOR ANALYSIS (PHÂN TÍCH NHÂN TỐ)
Là phép rút gọn dữ liệu và biến bằng cách nhóm
chúng lại với các nhân tố đại diện

Điều kiện: các biến phải có thang đo metric


Ứng dụng

•   Xây dựng bộ thang đo Multiple – item
•   Xác định cấu trúc bộ dữ liệu
•   Giảm thứ nguyên trong tập dữ liệu, rút gọn dữ liệu
Thí dụ:
                     Case   X1   X2   X3   …     …     Xm
Factor analysis:
gom     m     biến    1
thành k factor        2
Tùy mục đích bài    3
toán,   có    thể
dùng: Exploratory  …
factor   analysis   n
(EFA)       hoặc
Confirmatory      Factor 1 gồm X1     X6   X9    Xm
factor   analysis        2 gồm X2     X3   X10   Xm - 1
(CFA)                    3 gồm X4     X5   X7    X8     ...
CLUSTER ANALYSIS (PHÂN TÍCH NHÓM)

                Phân chia các đối tượng/ người thành
                các nhóm với các thành viên trong
                nhóm có các đặc trưng tương tự.

  Mục tiêu

Thí dụ:   Bài toán phân khúc thị trường (Segmentation)
          Phân loại hành vi mua (Typology)
CLUSTER ANALYSIS (PHÂN TÍCH NHÓM)
Quá trình thực hiện

Xác định các biến làm cơ sở để phân nhóm


    Phần chia các nhóm dựa trên sự tương tự


        Đặc tên nhóm dựa theo đặc điểm chung
        của các thuộc tính (các biến cơ sở)

            Chuẩn định (Validation) và mô tả đặc trưng
            (profiling)
Thí dụ: Cluster analysis để phân khúc thị trường
Yêu cầu thang đo: metric
Công ty TICO: Xác định các Nhóm Khách Hàng khác
nhau căn cứ trên hành vi mua.
“Hãy đánh giá mức độ quan trọng của các yếu tố sau đây
trong quyết định mua hàng của Ông/ Bà”
X1 – Chất lượng sản phẩm
X2 – Giá bánX3 – Thời gian giao hàng
X4 – Uy tín nhà sản xuất
X5 – Các dịch vụ đi kèm
                       Không qtrọng            Rất qtrọng

                           1   2   3   4   5   6   7
Thí dụ: Cluster analysis để phân khúc thị trường
      Hơn 300 khách hàng được khảo sát
      Nhận dạng ra các nhóm khác nhau.
      Trong mỗi nhóm có sự tương tự nhau về tầm quan
      trọng của các yếu tố (X1     X5) ảnh hưởng đến quyết
      định mua.
                                              Nhóm 1
Nhóm 1: X1, X4, X5 là quan trọng trong
                                           Khách hàng trẻ,
quyết định mua
                                         thu nhập cao, ở
Nhóm 2: X1, X2, X3 là quan trọng.        TP...
                                                  Nhóm 2
    TICO sẽ có chiến lược tiếp thị đối      Khách hàng
với từng nhóm khách hàng khác nhau.         công nghiệp –
                                            sản xuất
MULTIDIMENTIONAL SCALING (perceptual mapping)
  Mục đích: Xác định số lượng và bản chất của các thứ
  nguyên (dimensions) đặc trưng cho nhận thức/ đánh giá
  của khách hàng về các đối tượng.
  Thang đo: Cả hai loại thang metric/nonmetric
  Trong MR: Thường được sử dụng trong bài toán xác định
  vị trí tương đối (relative position) của các nhãn hiệu cạnh
  tranh nhau do phản hồi từ phía khách hàng.
  Xác định những yếu tố đặc trưng cho việc đánh giá của
  khách hàng.
  Là phương pháp ngược với Cluster
Multidimentional           Cluster
    Scaling               Analaysis
• Phát hiện các thứ   • Gộp các đối tượng
  nguyên đặc trưng      thành các nhóm
  (Underlying           theo 1 số đặc tính
  Dimensions)    từ     tượng tự nhau
  các phản hồi
KỸ THUẬT ĐO VÀ
THU THẬP DỮ LIỆU

Contenu connexe

Tendances

Chapter 4 kiem dinh thong ke
Chapter 4 kiem dinh thong keChapter 4 kiem dinh thong ke
Chapter 4 kiem dinh thong kepmxuandba
 
Chương 4 phân đoạn thị trường lựa chọn thị trường mục tiêu và định vị sản phẩm
Chương 4 phân đoạn thị trường lựa chọn thị trường mục tiêu và định vị sản phẩmChương 4 phân đoạn thị trường lựa chọn thị trường mục tiêu và định vị sản phẩm
Chương 4 phân đoạn thị trường lựa chọn thị trường mục tiêu và định vị sản phẩmhttps://www.facebook.com/garmentspace
 
phân tích hoạt động marketing của công ty cổ phần vàng bạc đá quý phú nhuận ...
phân tích hoạt động marketing của công ty cổ phần  vàng bạc đá quý phú nhuận ...phân tích hoạt động marketing của công ty cổ phần  vàng bạc đá quý phú nhuận ...
phân tích hoạt động marketing của công ty cổ phần vàng bạc đá quý phú nhuận ...anh hieu
 
Bảng giá trị hàm Laplace
Bảng giá trị hàm LaplaceBảng giá trị hàm Laplace
Bảng giá trị hàm Laplacehiendoanht
 
Bai giang mon hanh vi khach hang khoa qtkd
Bai giang mon hanh vi khach hang khoa qtkdBai giang mon hanh vi khach hang khoa qtkd
Bai giang mon hanh vi khach hang khoa qtkdTan Pham
 
tiểu luận quan hệ công chúng
tiểu luận quan hệ công chúng tiểu luận quan hệ công chúng
tiểu luận quan hệ công chúng Kim Lài Hoàng Thị
 
Báo cáo thực tập tốt nghiệp. đề xuất giải pháp nâng cao hiệu quả marketing b...
Báo cáo thực  tập tốt nghiệp. đề xuất giải pháp nâng cao hiệu quả marketing b...Báo cáo thực  tập tốt nghiệp. đề xuất giải pháp nâng cao hiệu quả marketing b...
Báo cáo thực tập tốt nghiệp. đề xuất giải pháp nâng cao hiệu quả marketing b...Minh Nguyen
 
bài marketing Sắc Ngọc Khang
bài marketing Sắc Ngọc Khangbài marketing Sắc Ngọc Khang
bài marketing Sắc Ngọc KhangNguyen Viet Tuan
 
Kế hoạch marketing phòng Nha Khoa Thẩm Mỹ Tây Đô
Kế hoạch marketing phòng Nha Khoa Thẩm Mỹ Tây ĐôKế hoạch marketing phòng Nha Khoa Thẩm Mỹ Tây Đô
Kế hoạch marketing phòng Nha Khoa Thẩm Mỹ Tây ĐôThanh Long
 
Phân tích chiến lược sản phẩm Omachi
Phân tích chiến lược sản phẩm Omachi Phân tích chiến lược sản phẩm Omachi
Phân tích chiến lược sản phẩm Omachi TranKimNgan10
 
MArketing dịch vụ: Vận dụng mô hình Serqual để đánh giá chất lượng dịch vụ ăn...
MArketing dịch vụ: Vận dụng mô hình Serqual để đánh giá chất lượng dịch vụ ăn...MArketing dịch vụ: Vận dụng mô hình Serqual để đánh giá chất lượng dịch vụ ăn...
MArketing dịch vụ: Vận dụng mô hình Serqual để đánh giá chất lượng dịch vụ ăn...Bui Thi Quynh Duong
 
Đề cương ôn tập Marketing Dịch vụ
Đề cương ôn tập Marketing Dịch vụĐề cương ôn tập Marketing Dịch vụ
Đề cương ôn tập Marketing Dịch vụSương Tuyết
 
100 Câu trắc nghiệm Marketing dịch vụ có Đáp án - sdt/ ZALO 093 189 2701
100 Câu trắc nghiệm Marketing dịch vụ có Đáp án - sdt/ ZALO 093 189 2701100 Câu trắc nghiệm Marketing dịch vụ có Đáp án - sdt/ ZALO 093 189 2701
100 Câu trắc nghiệm Marketing dịch vụ có Đáp án - sdt/ ZALO 093 189 2701Viết thuê báo cáo thực tập giá rẻ
 
Đề tài: Khảo sát mức độ hài lòng của người tiêu dùng về sản phẩm mì ăn liền, HAY
Đề tài: Khảo sát mức độ hài lòng của người tiêu dùng về sản phẩm mì ăn liền, HAYĐề tài: Khảo sát mức độ hài lòng của người tiêu dùng về sản phẩm mì ăn liền, HAY
Đề tài: Khảo sát mức độ hài lòng của người tiêu dùng về sản phẩm mì ăn liền, HAYViết thuê trọn gói ZALO 0934573149
 
Kho 200 Đề Tài Khóa Luận Tốt Nghiệp Ngành Nhà Hàng, 9 Điểm Từ Sinh Viên Khá Giỏi
Kho 200 Đề Tài Khóa Luận Tốt Nghiệp Ngành Nhà Hàng, 9 Điểm Từ Sinh Viên Khá GiỏiKho 200 Đề Tài Khóa Luận Tốt Nghiệp Ngành Nhà Hàng, 9 Điểm Từ Sinh Viên Khá Giỏi
Kho 200 Đề Tài Khóa Luận Tốt Nghiệp Ngành Nhà Hàng, 9 Điểm Từ Sinh Viên Khá GiỏiDịch vụ viết bài trọn gói ZALO 0917193864
 
Marketing mix trong công ty lữ hành
Marketing mix trong công ty lữ hànhMarketing mix trong công ty lữ hành
Marketing mix trong công ty lữ hànhVương Hùng Vũ
 

Tendances (20)

Chapter 4 kiem dinh thong ke
Chapter 4 kiem dinh thong keChapter 4 kiem dinh thong ke
Chapter 4 kiem dinh thong ke
 
Chương 4 phân đoạn thị trường lựa chọn thị trường mục tiêu và định vị sản phẩm
Chương 4 phân đoạn thị trường lựa chọn thị trường mục tiêu và định vị sản phẩmChương 4 phân đoạn thị trường lựa chọn thị trường mục tiêu và định vị sản phẩm
Chương 4 phân đoạn thị trường lựa chọn thị trường mục tiêu và định vị sản phẩm
 
phân tích hoạt động marketing của công ty cổ phần vàng bạc đá quý phú nhuận ...
phân tích hoạt động marketing của công ty cổ phần  vàng bạc đá quý phú nhuận ...phân tích hoạt động marketing của công ty cổ phần  vàng bạc đá quý phú nhuận ...
phân tích hoạt động marketing của công ty cổ phần vàng bạc đá quý phú nhuận ...
 
Bảng giá trị hàm Laplace
Bảng giá trị hàm LaplaceBảng giá trị hàm Laplace
Bảng giá trị hàm Laplace
 
Bai giang mon hanh vi khach hang khoa qtkd
Bai giang mon hanh vi khach hang khoa qtkdBai giang mon hanh vi khach hang khoa qtkd
Bai giang mon hanh vi khach hang khoa qtkd
 
tiểu luận quan hệ công chúng
tiểu luận quan hệ công chúng tiểu luận quan hệ công chúng
tiểu luận quan hệ công chúng
 
Báo cáo thực tập tốt nghiệp. đề xuất giải pháp nâng cao hiệu quả marketing b...
Báo cáo thực  tập tốt nghiệp. đề xuất giải pháp nâng cao hiệu quả marketing b...Báo cáo thực  tập tốt nghiệp. đề xuất giải pháp nâng cao hiệu quả marketing b...
Báo cáo thực tập tốt nghiệp. đề xuất giải pháp nâng cao hiệu quả marketing b...
 
bài marketing Sắc Ngọc Khang
bài marketing Sắc Ngọc Khangbài marketing Sắc Ngọc Khang
bài marketing Sắc Ngọc Khang
 
Kế hoạch marketing phòng Nha Khoa Thẩm Mỹ Tây Đô
Kế hoạch marketing phòng Nha Khoa Thẩm Mỹ Tây ĐôKế hoạch marketing phòng Nha Khoa Thẩm Mỹ Tây Đô
Kế hoạch marketing phòng Nha Khoa Thẩm Mỹ Tây Đô
 
Luận án: Nghiên cứu tật khúc xạ và mô hình can thiệp ở học sinh
Luận án: Nghiên cứu tật khúc xạ và mô hình can thiệp ở học sinhLuận án: Nghiên cứu tật khúc xạ và mô hình can thiệp ở học sinh
Luận án: Nghiên cứu tật khúc xạ và mô hình can thiệp ở học sinh
 
Phân tích chiến lược sản phẩm Omachi
Phân tích chiến lược sản phẩm Omachi Phân tích chiến lược sản phẩm Omachi
Phân tích chiến lược sản phẩm Omachi
 
Đề tài: Lập dự án quán cafe sinh viên, 9 ĐIỂM!
Đề tài: Lập dự án quán cafe sinh viên, 9 ĐIỂM!Đề tài: Lập dự án quán cafe sinh viên, 9 ĐIỂM!
Đề tài: Lập dự án quán cafe sinh viên, 9 ĐIỂM!
 
MArketing dịch vụ: Vận dụng mô hình Serqual để đánh giá chất lượng dịch vụ ăn...
MArketing dịch vụ: Vận dụng mô hình Serqual để đánh giá chất lượng dịch vụ ăn...MArketing dịch vụ: Vận dụng mô hình Serqual để đánh giá chất lượng dịch vụ ăn...
MArketing dịch vụ: Vận dụng mô hình Serqual để đánh giá chất lượng dịch vụ ăn...
 
Đề cương ôn tập Marketing Dịch vụ
Đề cương ôn tập Marketing Dịch vụĐề cương ôn tập Marketing Dịch vụ
Đề cương ôn tập Marketing Dịch vụ
 
100 Câu trắc nghiệm Marketing dịch vụ có Đáp án - sdt/ ZALO 093 189 2701
100 Câu trắc nghiệm Marketing dịch vụ có Đáp án - sdt/ ZALO 093 189 2701100 Câu trắc nghiệm Marketing dịch vụ có Đáp án - sdt/ ZALO 093 189 2701
100 Câu trắc nghiệm Marketing dịch vụ có Đáp án - sdt/ ZALO 093 189 2701
 
Marketing trắc nghiệm
Marketing trắc nghiệmMarketing trắc nghiệm
Marketing trắc nghiệm
 
Đề tài: Khảo sát mức độ hài lòng của người tiêu dùng về sản phẩm mì ăn liền, HAY
Đề tài: Khảo sát mức độ hài lòng của người tiêu dùng về sản phẩm mì ăn liền, HAYĐề tài: Khảo sát mức độ hài lòng của người tiêu dùng về sản phẩm mì ăn liền, HAY
Đề tài: Khảo sát mức độ hài lòng của người tiêu dùng về sản phẩm mì ăn liền, HAY
 
Kho 200 Đề Tài Khóa Luận Tốt Nghiệp Ngành Nhà Hàng, 9 Điểm Từ Sinh Viên Khá Giỏi
Kho 200 Đề Tài Khóa Luận Tốt Nghiệp Ngành Nhà Hàng, 9 Điểm Từ Sinh Viên Khá GiỏiKho 200 Đề Tài Khóa Luận Tốt Nghiệp Ngành Nhà Hàng, 9 Điểm Từ Sinh Viên Khá Giỏi
Kho 200 Đề Tài Khóa Luận Tốt Nghiệp Ngành Nhà Hàng, 9 Điểm Từ Sinh Viên Khá Giỏi
 
Bai giang mkt mix
Bai giang mkt mixBai giang mkt mix
Bai giang mkt mix
 
Marketing mix trong công ty lữ hành
Marketing mix trong công ty lữ hànhMarketing mix trong công ty lữ hành
Marketing mix trong công ty lữ hành
 

Similaire à Business Research Method 6

Thống kê mô tả & Ước lượng thống kê
Thống kê mô tả & Ước lượng thống kêThống kê mô tả & Ước lượng thống kê
Thống kê mô tả & Ước lượng thống kêYen Luong-Thanh
 
TKSD - TKCKHXH.pptx
TKSD - TKCKHXH.pptxTKSD - TKCKHXH.pptx
TKSD - TKCKHXH.pptxMinerPhcVinh
 
Dai cuong ve phan tich dung cu truong dai hoc y thai binh
Dai cuong ve phan tich dung cu truong dai hoc y thai binhDai cuong ve phan tich dung cu truong dai hoc y thai binh
Dai cuong ve phan tich dung cu truong dai hoc y thai binhNguyen Thanh Tu Collection
 
Phân tích thống kê cơ bản với stata
Phân tích thống kê cơ bản với stataPhân tích thống kê cơ bản với stata
Phân tích thống kê cơ bản với stataSoM
 
Bai TH5. So sanh cac ty le va kiem dinh tinh doc lap (04TH).ppt
Bai TH5. So sanh cac ty le va kiem dinh tinh doc lap (04TH).pptBai TH5. So sanh cac ty le va kiem dinh tinh doc lap (04TH).ppt
Bai TH5. So sanh cac ty le va kiem dinh tinh doc lap (04TH).pptDngTrn603952
 
Phương pháp xử lý số liệu
Phương pháp xử lý số liệuPhương pháp xử lý số liệu
Phương pháp xử lý số liệunguoitinhmenyeu
 
he-thong-cong-thuc-mon-nguyen-ly-thong-ke-new.pdf
he-thong-cong-thuc-mon-nguyen-ly-thong-ke-new.pdfhe-thong-cong-thuc-mon-nguyen-ly-thong-ke-new.pdf
he-thong-cong-thuc-mon-nguyen-ly-thong-ke-new.pdfLinho749143
 
Nghiên cứu Marketing - Chương 5 : Đo lường
Nghiên cứu Marketing - Chương 5 : Đo lườngNghiên cứu Marketing - Chương 5 : Đo lường
Nghiên cứu Marketing - Chương 5 : Đo lườngkudos21
 
Thống kê máy tính chương 6
Thống kê máy tính chương 6Thống kê máy tính chương 6
Thống kê máy tính chương 6ThyTrangTrnV
 
Huong dan thuc_hanh_spss
Huong dan thuc_hanh_spssHuong dan thuc_hanh_spss
Huong dan thuc_hanh_spssTri Minh
 
(4) Giới thiệu về thống kê cho các ngành khoa học xã hội_Bài giảng 4: Kiểm đị...
(4) Giới thiệu về thống kê cho các ngành khoa học xã hội_Bài giảng 4: Kiểm đị...(4) Giới thiệu về thống kê cho các ngành khoa học xã hội_Bài giảng 4: Kiểm đị...
(4) Giới thiệu về thống kê cho các ngành khoa học xã hội_Bài giảng 4: Kiểm đị...Development and Policies Research Center (DEPOCEN)
 
Phân tích phương sai đa biến 1 chiều (MANOVA).pdf
Phân tích phương sai đa biến 1 chiều (MANOVA).pdfPhân tích phương sai đa biến 1 chiều (MANOVA).pdf
Phân tích phương sai đa biến 1 chiều (MANOVA).pdfThuHuynPhm8
 
Huong dan thuc_hanh_spss_th_s_pham_le_hong_nhung
Huong dan thuc_hanh_spss_th_s_pham_le_hong_nhungHuong dan thuc_hanh_spss_th_s_pham_le_hong_nhung
Huong dan thuc_hanh_spss_th_s_pham_le_hong_nhungNguyễn Ngọc Trâm
 
Test thong ke
Test thong keTest thong ke
Test thong kethang_ph
 
Chon mau va co mau hvm
Chon mau va co mau hvmChon mau va co mau hvm
Chon mau va co mau hvmNgoc Hoang
 
Toán ứng dụng - QLCN Chapter 2 - P2.pptx
Toán ứng dụng - QLCN Chapter 2 - P2.pptxToán ứng dụng - QLCN Chapter 2 - P2.pptx
Toán ứng dụng - QLCN Chapter 2 - P2.pptxtub2203924
 
Chuong3_Maungaunhienvabtuocluong.pdf
Chuong3_Maungaunhienvabtuocluong.pdfChuong3_Maungaunhienvabtuocluong.pdf
Chuong3_Maungaunhienvabtuocluong.pdfHaiNguyen858754
 

Similaire à Business Research Method 6 (20)

Thong ke ung dung trong hoa hoc
Thong ke ung dung trong hoa hocThong ke ung dung trong hoa hoc
Thong ke ung dung trong hoa hoc
 
Thống kê mô tả & Ước lượng thống kê
Thống kê mô tả & Ước lượng thống kêThống kê mô tả & Ước lượng thống kê
Thống kê mô tả & Ước lượng thống kê
 
TKSD - TKCKHXH.pptx
TKSD - TKCKHXH.pptxTKSD - TKCKHXH.pptx
TKSD - TKCKHXH.pptx
 
Dai cuong ve phan tich dung cu truong dai hoc y thai binh
Dai cuong ve phan tich dung cu truong dai hoc y thai binhDai cuong ve phan tich dung cu truong dai hoc y thai binh
Dai cuong ve phan tich dung cu truong dai hoc y thai binh
 
Phân tích thống kê cơ bản với stata
Phân tích thống kê cơ bản với stataPhân tích thống kê cơ bản với stata
Phân tích thống kê cơ bản với stata
 
Bai TH5. So sanh cac ty le va kiem dinh tinh doc lap (04TH).ppt
Bai TH5. So sanh cac ty le va kiem dinh tinh doc lap (04TH).pptBai TH5. So sanh cac ty le va kiem dinh tinh doc lap (04TH).ppt
Bai TH5. So sanh cac ty le va kiem dinh tinh doc lap (04TH).ppt
 
Phương pháp xử lý số liệu
Phương pháp xử lý số liệuPhương pháp xử lý số liệu
Phương pháp xử lý số liệu
 
he-thong-cong-thuc-mon-nguyen-ly-thong-ke-new.pdf
he-thong-cong-thuc-mon-nguyen-ly-thong-ke-new.pdfhe-thong-cong-thuc-mon-nguyen-ly-thong-ke-new.pdf
he-thong-cong-thuc-mon-nguyen-ly-thong-ke-new.pdf
 
Nghiên cứu Marketing - Chương 5 : Đo lường
Nghiên cứu Marketing - Chương 5 : Đo lườngNghiên cứu Marketing - Chương 5 : Đo lường
Nghiên cứu Marketing - Chương 5 : Đo lường
 
Thống kê máy tính chương 6
Thống kê máy tính chương 6Thống kê máy tính chương 6
Thống kê máy tính chương 6
 
Chapter 7
Chapter 7Chapter 7
Chapter 7
 
Bai 6 phan tich rui ro
Bai 6 phan tich rui roBai 6 phan tich rui ro
Bai 6 phan tich rui ro
 
Huong dan thuc_hanh_spss
Huong dan thuc_hanh_spssHuong dan thuc_hanh_spss
Huong dan thuc_hanh_spss
 
(4) Giới thiệu về thống kê cho các ngành khoa học xã hội_Bài giảng 4: Kiểm đị...
(4) Giới thiệu về thống kê cho các ngành khoa học xã hội_Bài giảng 4: Kiểm đị...(4) Giới thiệu về thống kê cho các ngành khoa học xã hội_Bài giảng 4: Kiểm đị...
(4) Giới thiệu về thống kê cho các ngành khoa học xã hội_Bài giảng 4: Kiểm đị...
 
Phân tích phương sai đa biến 1 chiều (MANOVA).pdf
Phân tích phương sai đa biến 1 chiều (MANOVA).pdfPhân tích phương sai đa biến 1 chiều (MANOVA).pdf
Phân tích phương sai đa biến 1 chiều (MANOVA).pdf
 
Huong dan thuc_hanh_spss_th_s_pham_le_hong_nhung
Huong dan thuc_hanh_spss_th_s_pham_le_hong_nhungHuong dan thuc_hanh_spss_th_s_pham_le_hong_nhung
Huong dan thuc_hanh_spss_th_s_pham_le_hong_nhung
 
Test thong ke
Test thong keTest thong ke
Test thong ke
 
Chon mau va co mau hvm
Chon mau va co mau hvmChon mau va co mau hvm
Chon mau va co mau hvm
 
Toán ứng dụng - QLCN Chapter 2 - P2.pptx
Toán ứng dụng - QLCN Chapter 2 - P2.pptxToán ứng dụng - QLCN Chapter 2 - P2.pptx
Toán ứng dụng - QLCN Chapter 2 - P2.pptx
 
Chuong3_Maungaunhienvabtuocluong.pdf
Chuong3_Maungaunhienvabtuocluong.pdfChuong3_Maungaunhienvabtuocluong.pdf
Chuong3_Maungaunhienvabtuocluong.pdf
 

Plus de Calvin Nguyen

220707_afflefintechreport_v03_vi.pdf
220707_afflefintechreport_v03_vi.pdf220707_afflefintechreport_v03_vi.pdf
220707_afflefintechreport_v03_vi.pdfCalvin Nguyen
 
Keeping up with Google 2014
Keeping up with Google 2014Keeping up with Google 2014
Keeping up with Google 2014Calvin Nguyen
 
How today's email marketing are connecting, engaging and inspiring customers
How today's email marketing are connecting, engaging and inspiring customersHow today's email marketing are connecting, engaging and inspiring customers
How today's email marketing are connecting, engaging and inspiring customersCalvin Nguyen
 
The Advanced Guide to SEO
The Advanced Guide to SEOThe Advanced Guide to SEO
The Advanced Guide to SEOCalvin Nguyen
 
The Science of Social Media Advertising
The Science of Social Media AdvertisingThe Science of Social Media Advertising
The Science of Social Media AdvertisingCalvin Nguyen
 
Mobile in Store Research Studies
Mobile in Store Research StudiesMobile in Store Research Studies
Mobile in Store Research StudiesCalvin Nguyen
 
Graphic Design Colors
Graphic Design ColorsGraphic Design Colors
Graphic Design ColorsCalvin Nguyen
 
Quy trinh hoach dinh digital marketing qua coca cola case study
Quy trinh hoach dinh digital marketing qua coca cola case studyQuy trinh hoach dinh digital marketing qua coca cola case study
Quy trinh hoach dinh digital marketing qua coca cola case studyCalvin Nguyen
 
Checklist for life kills
Checklist for life killsChecklist for life kills
Checklist for life killsCalvin Nguyen
 
Lonely Planet brand story - Travel and Social Media
Lonely Planet brand story -  Travel and Social MediaLonely Planet brand story -  Travel and Social Media
Lonely Planet brand story - Travel and Social MediaCalvin Nguyen
 
Blendtec case study - How one company used video marketing to increase sales ...
Blendtec case study - How one company used video marketing to increase sales ...Blendtec case study - How one company used video marketing to increase sales ...
Blendtec case study - How one company used video marketing to increase sales ...Calvin Nguyen
 
Vietnamese consumer’s shopping habit for Tet holiday
Vietnamese consumer’s shopping habit for Tet holidayVietnamese consumer’s shopping habit for Tet holiday
Vietnamese consumer’s shopping habit for Tet holidayCalvin Nguyen
 
Guidelines for online success
Guidelines for online successGuidelines for online success
Guidelines for online successCalvin Nguyen
 
Các phương pháp quảng cáo thực nghiệm - Cac phuong phap quang cao thuc nghiem
Các phương pháp quảng cáo thực nghiệm - Cac phuong phap quang cao thuc nghiemCác phương pháp quảng cáo thực nghiệm - Cac phuong phap quang cao thuc nghiem
Các phương pháp quảng cáo thực nghiệm - Cac phuong phap quang cao thuc nghiemCalvin Nguyen
 
Social Media Guide for Luxury Brands
Social Media Guide for Luxury BrandsSocial Media Guide for Luxury Brands
Social Media Guide for Luxury BrandsCalvin Nguyen
 
Vietnam Digital Landscape 2013
Vietnam Digital Landscape  2013Vietnam Digital Landscape  2013
Vietnam Digital Landscape 2013Calvin Nguyen
 
Sự khác nhau giữa Mèo và Chó | Su khac nhau giua Meo va Cho
Sự khác nhau giữa Mèo và Chó | Su khac nhau giua Meo va ChoSự khác nhau giữa Mèo và Chó | Su khac nhau giua Meo va Cho
Sự khác nhau giữa Mèo và Chó | Su khac nhau giua Meo va ChoCalvin Nguyen
 
Cho Phu Quoc - Phuong phap nuoi cho Phu Quoc
Cho Phu Quoc - Phuong phap nuoi cho Phu QuocCho Phu Quoc - Phuong phap nuoi cho Phu Quoc
Cho Phu Quoc - Phuong phap nuoi cho Phu QuocCalvin Nguyen
 
Fifa Football Award Men Player 2012 by Country
Fifa Football Award Men Player 2012 by CountryFifa Football Award Men Player 2012 by Country
Fifa Football Award Men Player 2012 by CountryCalvin Nguyen
 

Plus de Calvin Nguyen (20)

220707_afflefintechreport_v03_vi.pdf
220707_afflefintechreport_v03_vi.pdf220707_afflefintechreport_v03_vi.pdf
220707_afflefintechreport_v03_vi.pdf
 
Keeping up with Google 2014
Keeping up with Google 2014Keeping up with Google 2014
Keeping up with Google 2014
 
How today's email marketing are connecting, engaging and inspiring customers
How today's email marketing are connecting, engaging and inspiring customersHow today's email marketing are connecting, engaging and inspiring customers
How today's email marketing are connecting, engaging and inspiring customers
 
The Advanced Guide to SEO
The Advanced Guide to SEOThe Advanced Guide to SEO
The Advanced Guide to SEO
 
The Science of Social Media Advertising
The Science of Social Media AdvertisingThe Science of Social Media Advertising
The Science of Social Media Advertising
 
Brand Voice Guide
Brand Voice GuideBrand Voice Guide
Brand Voice Guide
 
Mobile in Store Research Studies
Mobile in Store Research StudiesMobile in Store Research Studies
Mobile in Store Research Studies
 
Graphic Design Colors
Graphic Design ColorsGraphic Design Colors
Graphic Design Colors
 
Quy trinh hoach dinh digital marketing qua coca cola case study
Quy trinh hoach dinh digital marketing qua coca cola case studyQuy trinh hoach dinh digital marketing qua coca cola case study
Quy trinh hoach dinh digital marketing qua coca cola case study
 
Checklist for life kills
Checklist for life killsChecklist for life kills
Checklist for life kills
 
Lonely Planet brand story - Travel and Social Media
Lonely Planet brand story -  Travel and Social MediaLonely Planet brand story -  Travel and Social Media
Lonely Planet brand story - Travel and Social Media
 
Blendtec case study - How one company used video marketing to increase sales ...
Blendtec case study - How one company used video marketing to increase sales ...Blendtec case study - How one company used video marketing to increase sales ...
Blendtec case study - How one company used video marketing to increase sales ...
 
Vietnamese consumer’s shopping habit for Tet holiday
Vietnamese consumer’s shopping habit for Tet holidayVietnamese consumer’s shopping habit for Tet holiday
Vietnamese consumer’s shopping habit for Tet holiday
 
Guidelines for online success
Guidelines for online successGuidelines for online success
Guidelines for online success
 
Các phương pháp quảng cáo thực nghiệm - Cac phuong phap quang cao thuc nghiem
Các phương pháp quảng cáo thực nghiệm - Cac phuong phap quang cao thuc nghiemCác phương pháp quảng cáo thực nghiệm - Cac phuong phap quang cao thuc nghiem
Các phương pháp quảng cáo thực nghiệm - Cac phuong phap quang cao thuc nghiem
 
Social Media Guide for Luxury Brands
Social Media Guide for Luxury BrandsSocial Media Guide for Luxury Brands
Social Media Guide for Luxury Brands
 
Vietnam Digital Landscape 2013
Vietnam Digital Landscape  2013Vietnam Digital Landscape  2013
Vietnam Digital Landscape 2013
 
Sự khác nhau giữa Mèo và Chó | Su khac nhau giua Meo va Cho
Sự khác nhau giữa Mèo và Chó | Su khac nhau giua Meo va ChoSự khác nhau giữa Mèo và Chó | Su khac nhau giua Meo va Cho
Sự khác nhau giữa Mèo và Chó | Su khac nhau giua Meo va Cho
 
Cho Phu Quoc - Phuong phap nuoi cho Phu Quoc
Cho Phu Quoc - Phuong phap nuoi cho Phu QuocCho Phu Quoc - Phuong phap nuoi cho Phu Quoc
Cho Phu Quoc - Phuong phap nuoi cho Phu Quoc
 
Fifa Football Award Men Player 2012 by Country
Fifa Football Award Men Player 2012 by CountryFifa Football Award Men Player 2012 by Country
Fifa Football Award Men Player 2012 by Country
 

Business Research Method 6

  • 2. Xử lý dữ liệu Phân tích đơn biến Phân tích nhị biến Tổng quan về phân tích đa biến
  • 3. Xử lý dữ liệu Phân tích đơn biến Phân tích nhị biến Tổng quan về phân tích đa biến
  • 4. Hiệu chỉnh (Editing) Mã hoá (Coding) Tạo tập tin dữ liệu
  • 5. Mục đích Đúng thủ tục/đối tượng phỏng vấn (legibility) Xử lý các phỏng vấn/trả lời không hoàn chỉnh (completeness) Tính nhất quán của các trả lời (consistency) Sự chính xác của các trả lời (accuracy) Sự rõ ràng của các trả lời (clarification)
  • 6. Quá trình Hiệu chỉnh sơ bộ (field editing): • Thực hiện bởi interviewer • Càng sớm càng tốt sau khi phỏng vấn xong Hiệu chỉnh cuối cùng (office editing): • Thực hiện bởi editor • Sau khi thu thập xong data • Đòi hỏi người hiệu chỉnh phải có nhiều kinh nghiệm, kiến thức.
  • 7. Xử lý khi phát hiện lỗi Liên lạc trở lại để bổ sung hoặc làm rõ Hiệu chỉnh, làm rõ hoặc bổ sung theo trí nhớ hoặc các cứ liệu/suy luận khác Hủy bỏ một số câu trả lời (missing value) Hủy hoàn toàn cuộc phỏng vấn/questionnaire
  • 8. Là quá trình gán mã số (số hoặc nhãn) cho các biến và các trả lời. Thang đo của biến tùy thuộc vào cách hỏi và bản chất của biến được hỏi.
  • 9. Các bước mã hoá ◦ Đặt tên biến cho các câu hỏi Câu hỏi 1 chọn lựa Câu hỏi nhiều chọn lựa ◦ Chuyển tập các chọn lựa trả lời của mỗi câu hỏi thành tập các số/nhãn phù hợp, có ý nghĩa. Câu hỏi đóng Câu hỏi mở Câu hỏi có chọn lựa: “Khác” Hai trường hợp “Không biết”
  • 10. Tính phù hợp Tính toàn diện (appropriateness) (exhaustiveness) NGUYÊN TẮC Tính loại trừ nhau Tính đơn nguyên (mutual exclusivity) (unidimensionality)
  • 11. Tính phù hợp (appropriateness) Thí dụ: Thông tin cá nhân Cách phân loại/ nhóm hoặc doanh nghiệp. phải phù hợp với vấn Tuổi <18 18-30 …. ? đề/ mục tiêu nghiên <16 16-25 …. ? cứu.
  • 12. Tính toàn diện (exhaustiveness) Các mã số cần thể Thí dụ: Tuổi <18 hiện các loại cần NC. 18-30 Loại “trả lời khác” nên >30 chiếm tỉ lệ nhỏ nhất. ??
  • 13. Mỗi trả lời chỉ tương ứng với một mã số. Thí dụ: quốc doanh, tư Tính loại trừ nhau nhân, TNHH, cổ phần ?? (mutual exclusivity)
  • 14. Mỗi câu trả lời ứng với một thứ nguyên duy nhất. Tính đơn nguyên (unidimensionality)
  • 15. Nhập dữ liệu vào file (SPSS) Cải biến tập dữ liệu Tạo biến mới, biến trung gian, v.v. Xử lý missing value Thí dụ về data file
  • 16. Xử lý dữ liệu Phân tích đơn biến Phân tích nhị biến Tổng quan về phân tích đa biến
  • 17. Tổng quan về phân tích dữ liệu Tổng quát về phân tích đơn biến Thống kê mô tả Kiểm nghiệm giả thuyết đơn biến
  • 18. Chọn phương pháp phân tích đơn biến nào? Tùy vào: Có bao nhiêu biến được phân tích đồng thời? Mục tiêu phân tích chỉ là mô tả mẫu hay suy đoán cho tổng thể Các biến được đo bởi thang đo gì? Chỉ danh, thứ tự, khoảng, tỉ lệ.
  • 19. Start Bao nhiêu biến được phân tích đồng thời 1 biến Trên 2 biến 2 biến Phân tích Phân tích Phân tích đơn biến nhị biến đa biến
  • 20. Phân tích đơn biến Khoảng Thang đo Chỉ danh của biến Thứ tự MÔ TẢ Trung vị Trung bình Yếu vị Khoảng/ Phương sai Tần suất phần trăm SUY ĐOÁN Kolmogorov Chi – square Z test/ t test – Smirnov test test
  • 21. Biến chỉ danh, thứ tự Ví dụ Response Frequency Percentage Cum. Category Percentage Benthanh 1 - - Foster 3 1 1 Saigon 45 18 19 Heineken 120 46 65 Tiger 92 35 100 261 100%
  • 22. Lợi ích của biến chỉ danh, thứ tự: Trình bày phân phối dữ liệu của một biến có thang đo nominal hoặc ordinal. Phát hiện một số dạng sai sót khi mã hoá. So sánh với các phân phối/ dữ liệu có liên quan. Đề nghị những phương pháp biến đổi các biến Kiểm tra sampling.
  • 23. Biến khoảng N 215 Minimum 1 Maximum 5 Mean Statistic 2.25 Std. Error 0.06 Std. Deviation Statistic 0.83 Statistic 0.57 Skewness Std. Error 0.17 Statistic 0.45 Kurtosis Std. Error 0.33 Ví dụ
  • 24. Kiểm chứng xem những phát biểu nào đó có thích hợp cho tổng thể nghiên cứu hay không. • TD: Bình quân tuổi của 100 SV trong mẫu là Ā = 24 (s=5). Nhà NC muốn kiểm chứng cho tổng thể: • Null hypothesis Ho: µ = 23 • Alternative hypothesis H1: µ ≠ 23 Các phân tích liên quan đến kiểm nghiệm giả thuyết gọi là phân tích suy luận (inferential analysis).
  • 25. • Thiết lập giả thuyết H0 và H1 B1 • Xác định phương pháp test phù hợp (statistical test). B2 • Chọn trước mức ý nghĩa α (significance level) B3 • Tính (tra bảng) giá trị test tới hạn (critical value) ứng với α (one/ two tailed) B4 • Tính giá trị kiểm nghiệm thống kê từ tập số liệu B5 • Nếu giá trị tính được ở B5 lớn hơn giá trị tới hạn loại Ho B6
  • 26. Biến đo bằng thang khoảng (interval) ◦ Có thể dùng t Test hoặc Z Test để test giá trị trung bình của tổng thể khi biết giá trị trung bình của mẫu Z TEST t TEST Biết phương sai σ của tổng Không biết phương sai σ của thể và cỡ mẫu bất kỳ. tổng thể và cỡ mẫu bất kỳ. Không biết phương sai σ Khi cỡ mẫu n > 30 thì phân của tổng thể và cỡ mẫu n >30 phối t = phân phối z Lưu ý: khi tra bảng tc thì dF = n-1 x−μ t= Sx
  • 27. Thí dụ (tiếp theo thí dụ trên) Bình quân tuổi của 100 SV trong mẫu là Ā = 24 (s=5). Nhà NC muốn kiểm chứng cho tổng thể: Null hypothesis Ho: µ = 23 Alternative hypothesis H1: µ ≠ 23 Do n = 100 > 30 nên dùng Z test Chọn mức ý nghĩa α = 0.05 (two tailed) Zc = 1.96 Tính Z khi chưa biết σ : Z = (Ā - µ) n1/2/s = (24 - 23) x 1001/2/5 = 2 Z = 2 > Zc = 1.96 loại Ho Không thể kết luận (với significant 5%) là µ = 23 Lưu ý: Nếu biến tỉ lệ thì Z = (p - π)/ (pq/ n)1/2
  • 28. Biến đo bằng thang thứ tự (ordinal) ◦ Dùng chi-square test để so sánh phân phối các loại (categories) của mẫu và kỳ vọng của tổng thể Các bước tiến hành
  • 29. B2. Xác định mức B1. Phát biểu giả B3. Tra bảng Chi- ý nghĩa α và bậc χ c2 thuyết H0, H1 Square chuẩn tự do df df = k – 1 (k là số loại danh định có thể chọn trong biến thứ tự) B5. Bác bỏ/chấp nhận B4. Tính giá trị kiểm H0 dựa trên tiêu chuẩn nghiệm theo công thức “Bác bỏ H0- nếu (tính được) > (tới hạn)”. k ( O i − E i ) 2 Oi: Số lần xuất hiện loại i trong mẫu χ2 = ∑ i =1 Ei Ei: Giá trị kỳ vọng của số lần xuất hiện
  • 30. Biến đo bằng thang thứ tự (ordinal) ◦ Dùng chi-square test để so sánh phân phối các loại (categories) của mẫu và kỳ vọng của tổng thể Các bước tiến hành ◦ Nghĩa là có sự khác biệt giữa phân phối của mẫu và phân phối của tổng thể. ◦ Kiểm định Chi-Square không có ý nghĩa khi số lần xuất hiện kỳ vọng cho mỗi lựa chọn < 5.
  • 31. Thí dụ: Khảo sát 100 người đang sử dụng internet ở HCMC Nghề nghiệp Oi Ei Oi - Ei (Oi - Ei)2 (Oi - Ei)2/ Ei Lao động 15 25 -10 100 4 Nhân viên VP 20 25 -5 25 1 Quản lý 30 25 5 25 1 Sinh viên 35 25 10 100 4 Total 100 100 χ 2 =10
  • 32. Thí dụ: Khảo sát 100 người đang sử dụng internet ở HCMC (n = 100) Cột 1: Phân bố nghề nghiệp của những người sử dụng internet. Cột 2: Phân bố kỳ vọng (bằng nhau cho các nhóm) Ho: Không có sự khác nhau về nghề nghiệp của những người sử dụng internet K = 4 loại nghề nghiệp Df = k - 1 = 3 χ c = 6.25 ( với α = 10%) 2 Vì χ 2 = 10 > χ c2 = 6.25 loại bỏ H0
  • 33. Xử lý dữ liệu Phân tích đơn biến Phân tích nhị biến Tổng quan về phân tích đa biến
  • 34. Bảng 2 chiều (Two – way Tabulation) Khảo sát mức độ và các mối liên hệ (có thể có) giữa các cặp biến. Thích hợp cho các trường hợp số loại trong mỗi biến không lớn, thang đo nominal hoặc ordinal. Chỉ định hướng, không kết luận về mối quan hệ nhân quả giữa các biến. Kết quả có thể bị lệch nếu các ô có giá trị nhỏ.
  • 35. Function group Total Mkt & Prodct Others Sales Count 41 62 41 144 Male % within Gender 28.5% 43.1% 28.5% 100.0% % within Functgr 74.5% 93.9% 53.2% 72.7% Gender % of Total 20.7% 31.3% 20.7% 72.7% Count 14 4 36 54 Female % within Gender 25.9% 7.4% 66.7% 100.0% % within Functgr 25.5% 6.1% 46.8% 27.3% % of Total 7.1% 2.0% 18.2% 27.3% Count 55 66 77 198 % within Gender 27.8% 33.3% 38.9% 100.0% Total % within Functgr 100.0% 100.0% 100.0% 100.0% % of Total 27.8% 33.3% 38.9% 100.0%
  • 36. Phương pháp Áp dụng Minh họa Chi – Square Quan hệ giữa thu nhập Quan hệ giữa 2 biến Contingency (hoặc nghề nghiệp) với chỉ danh. Test việc chọn nhãn hiệu bia. Hệ số Quan hệ giữa mức thưởng Quan hệ giữa 2 biến nhân viên bán hàng (mức tương quan thứ tự. 1, 2, 3, 4) và thành tích Spearman (mức 1, 2, 3, 4, 5). Hệ số Quan hệ giữa 2 biến Quan hệ giữa tuổi của tương quan metric khách hàng và chi phí hàng Pearson (khoảng hay tỉ lệ). tháng cho y tế. Xây dựng một Hồi quy hàm tuyến tính giữa Doanh thu (đồng) theo chi đơn giản 2 biến metric phí khuyến mãi. (phụ thuộc nhau)
  • 37. Chi – Square contingency test Mục đích: Xác định sự tồn tại mối quan hệ giữa 2 biến danh định. Yêu cầu: Không có ô nào có số lần xuất hiện kỳ vọng < 1 Không quá 1/5 tổng số ô có số lần xuất hiện < 5 Hạn chế: Chỉ xác định có quan hệ hay không, không cho biết mức độ quan hệ.
  • 38. Hệ số Contingency thường được bổ sung vào kiểm nghiệm Chi-Square để biết mức độ quan hệ giữa 2 biến. χ 2 C = 0: không có quan hệ c= n+ χ2 C không có chặn trên khó diễn dịch Nên trong thực tế hay dùng hệ số thống kê Cramer χ2 V = 0: không có quan hệ v= n( f − 1) V = 1: có quan hệ hoàn hảo
  • 39. Thí dụ: Kết quả khảo sát nhãn hiệu Bia ưa thích nhất phân theo mức thu nhập. Nhãn hiệu bia ưa thích nhất Thu nhập Tổng Bia A Bia B Bia C 50 200 125 Thấp 375 (109.38) (101.56) (164.06) 200 100 350 Trung bình 650 (189.58) (176.04) (284.38) 100 25 50 Cao 175 (51.04) (47.40) (76.56) Tổng 350 325 525 1200
  • 40. Ghi chú: Con số trong ngoặc chỉ giá trị kỳ vọng của mỗi ô trong bảng. Chúng được xác định theo tỉ lệ với tổng về thu nhập và loại bia ưa thích. (Ô 1-1 có giá trị kỳ vọng = 350 x 375 / 1200 = 109.38) k (O − E ) 2 Tính χ = ∑i =1 ∑ 2 l ij ij j =1 Eij Kết quả : χ = 252.2 2 Df = (k-1)(l-1) = (3-1)(3-1) = 4 Nếu chọn α = 1% thì χ C = 13.3 (tra bảng) 2 χ 2 = 252.2 > χ C = 13.3 2 loại Ho Có sự khác biệt đáng kể giữa phân phối của mẫu và kỳ vọng (tổng thể)
  • 41. Hệ số tương quan Spearman và Pearson Spearman: tương quan giữa 2 biến thứ tự (ordinal) Pearson: tương quan giữa các biến khoảng/ tỉ lệ. Hệ số tương quan r = 0 1 (không kể dấu +/-) r > 0.8 rất mạnh r = 0.6 – 0.8 mạnh r = 0.4 – 0.6 có tương quan r = 0.2 – 0.4 tương quan yếu r < 0.2 không tương quan
  • 42. Lưu ý: Hai biến phải có phân phối chuẩn nhị biến. Phương sai của 1 biến tại bất kỳ giá trị nào của biến kia cũng phải bằng nhau. Khi r nhỏ không có nghĩa là không tương quan, mà chỉ không tương quan tuyến tính. Khi |r| lớn chỉ cho thấy mối tương quan, nhưng không xác định quan hệ nhân quả.
  • 43. Phân tích hồi quy tuyến tính đơn ◦ Phân tích 2 biến khoảng/ tỉ lệ: Hồi quy tuyến tính đơn Y = aX + b ◦ Sự khác biệt giữa hồi quy và tương quan Hồi quy tuyến tính Tương quan Tạo ra một phương Phát hiện ra mức độ trình toán học liên kết tương quan giữa các biến lại 2 biến Tồn tại giả thiết nhân – Không có giả thiết về quả: Biến độc lập – nhân quả Biến phụ thuộc
  • 44. Xử lý dữ liệu Phân tích đơn biến Phân tích nhị biến Tổng quan về phân tích đa biến
  • 45. Phân tích phụ thuộc • Xác định được biến nào là phụ thuộc, biến nào là độc lập • Bao gồm các phương pháp: phân tích hồi quy đa biến, ANOVA, Conjoint, Discriminant, Canonical analysis... Phân tích tương tác • Không xác định trước biến nào là phụ thuộc, biến nào là độc lập, chủ yếu là tìm kiếm các mô thức tương quan. • Bao gồm các phương pháp: Factor analaysis, Cluster, Multi-dimensional Scaling. Phân tích đa biến giúp giải quyết nhiều bài toán phức tạp. Tuy nhiên, mỗi phương pháp phân tích đa biến đều dựa trên một số giả thiết (ngầm) cần thận trọng.
  • 46. Các phương pháp phân tích phụ thuộc – Yêu cầu về thang đo Thang đo của biến Phương pháp Phụ thuộc Độc lập Một biến phụ thuộc Hồi quy bội Interval Interval ANOVA Interval Nominal Hồi quy bội - biến dummy Interval Nominal Discriminant analysis Nominal Interval Conjoint analysis Ordinal Nominal
  • 47. Các phương pháp phân tích phụ thuộc – Yêu cầu về thang đo Thang đo của biến Phương pháp Phụ thuộc Độc lập Hai biến phụ thuộc trở lên Canonical analysis Interval Interval MANOVA Interval Nominal Mạng lưới của nhiều biến phụ thuộc và độc lập Structural Equation Modeling Interval Interval (SEM)
  • 48. HỒI QUY TUYẾN TÍNH BỘI y = a1X1 + a2X2 + a3X3 + ... anXn + b Dạng mở rộng của hồi quy đơn. Một biến phụ thuộc, nhiều biến độc lập. Tất cả được đo bằng thang interval (ngoại lệ: dummy-variable multiple regression)
  • 49. Đánh giá mô hình và kết quả hồi quy theo 3 phần: Mức độ phù hợp của phương trình hồi quy: Dùng hệ số r2 (coefficient of determination) r2 = 0 ÷ 1 đặc trưng cho % của biến thiên trong biến phụ thuộc được giải thích do sự biến thiên của biến độc lập. Kiểm nghiệm mức ý nghĩa của r2: Dùng F – test, với độ tự do: df = n – k – 1 cho mẫu số và df = k cho tử số (n: cỡ mẫu, k: số biến độc lập) Kiểm nghiệm mức ý nghĩa của các độ dốc ai: Dùng t – test với độ tự do df = n – k – 1 ◦
  • 50. Kiểm nghiệm các giả thuyết của phương pháp hồi quy Linearity Đa cộng tuyến (Multicolinearity) Phân phối chuẩn (Normality) của sai số và mỗi biến Sai số hồi quy có variance không đổi Tính độc lập của các sai số hồi quy
  • 51. Linearity Có mối quan hệ tuyến tính giữa biến phụ thuộc và các biến độc lập. Test: quan sát scatter diagram hoặc ma trận tương quan
  • 52. Đa cộng tuyến (Multicolinearity) Giả thuyết: các biến độc lập không có tương quan tuyến tính với nhau. Khi bị vi phạm Có hiện tượng đa cộng tuyến, nghĩa là hiện hữu mối tương quan tuyến tính giữa ≥ 2 biến độc lập. Đa cộng tuyến gây ra: Hạn chế giá trị r2 Sai lệch/ đổi dấu các hệ số hồi quy Test đa cộng tuyến: hệ số Tolerance hoặc VIF
  • 53. Một số lưu ý khi sử dụng multiple regression: Phân tích hồi quy tuyến tính chỉ có nghĩa khi có tương quan TUYẾN TÍNH giữa các biến. r2 không nói lên được quan hệ nhân quả giữa các biến Có thể dự đoán sai nếu nằm ngoài khoản tính toán Để đảm bảo độ tin cậy phải có nhiều hơn 10 điểm cho mỗi biến độc lập đưa vào phương trình ( yêu cầu cỡ mẫu) Khoảng dao động (range) các biến có thể ảnh hưởng đến ý nghĩa phương trình hồi quy. Trường hợp biến độc lập là nominal thì có thể sử dụng dummy-variable. Khi đó: Số biến dummy = k-1; với k = số loại của biến nominal Mỗi biến dummy chỉ nhận giá trị 0 hoặc 1
  • 54. Thí dụ: Bài toán tìm các yếu tố quyết định sự thỏa mãn của nhân viên trong Cty XYZ. Biến phụ thuộc: sự thỏa mãn của nhân viên Cty. Biến độc lập: thu nhập, điều kiện làm việc, sự quan tâm của cấp trên, quan hệ với đồng nghiệp, cơ hội thăng tiến, cơ hội học tập, v.v..
  • 55. Unstandardized Standardized Coefficients Coefficients Collinearity Statistics Biến Std. B Beta độc lập Error t Sig. Tolerance VIF (Constant) .540 .193 2.793 .007 Thu nhập .526 .081 .596 6.491 .000 .793 1.262 Sự quan tâm/ .205 .061 .310 3.380 .001 .793 1.262 công nhận r = 0.787 r2 = 0.619 F sig. = 0.000
  • 56. ANOVA – ANALYSIS OF VARIANCE Mục đích Đặc điểm Áp dụng
  • 57. ANOVA – ANALYSIS OF VARIANCE Mục đích Đặc điểm Áp dụng
  • 58. ANOVA – ANALYSIS OF VARIANCE Mục đích Đặc điểm Áp dụng Khảo sát mối quan hệ giữa các biến độc lập và phụ thuộc
  • 59. ANOVA – ANALYSIS OF VARIANCE Mục đích Đặc điểm Áp dụng Tương tự như phân tích hồi quy, nhưng các biến độc lập là biến nonmetric (nominal/ ordinal)
  • 60. ANOVA – ANALYSIS OF VARIANCE Mục đích Đặc điểm Áp dụng So sánh giá trị trung bình của một thuộc tính (biến phụ thuộc/ thang metric) thể hiện ảnh hưởng của một hay nhiều thuộc tính khác (biến độc lập/thang nonmetric)
  • 61. ANOVA – ANALYSIS OF VARIANCE Nếu có nhiều biến độc lập với thang chỉ danh gọi là Factorial ANOVA Nguyên tắc: Nếu có sự khác biệt đáng kể giữa các nhóm thì “between-group variance > within-group variance” ANCOVA: có xét đến các ảnh hưởng của một hay nhiều biến ngoại lai (gọi là control variable hoặc covariates - thang đo metric) và sẽ loại ra khỏi tập biến phụ thuộc trước khi phân tích ANOVA. MANOVA nếu có nhiều biến phụ thuộc MANCOVA có nhiều biến phụ thuộc và biến kiểm soát
  • 62. Thí dụ: Khảo sát 200 doanh nghiệp thuộc 3 ngành May mặc, Mỹ phẩm và Nhựa gia dụng về chi phí dành cho khuyến mãi hằng năm. Mục đích phân tích nhằm tìm xem có sự khác nhau đáng kể/ có ý nghĩa thống kê giữa 3 ngành này về chi phí khuyến mãi không?
  • 63. Cty Ngành Chi phí KM (1000 USD) Biến độc lập: 1 May 123 ngành (chỉ danh) 2 May 235 (3 treatments) 3 Mỹ phẩm 1346 4 Nhựa 876 Biến phụ thuộc: . . . chi phí khuyến . . . mãi (ratio) 199 Nhựa 68 200 May 12
  • 64. Bài toán này có thể so sánh giá trị trung bình của chi phí khuyến mãi theo từng cặp ngành (dùng t – test). Tuy nhiên, khi số treatment lớn số lượng so sánh sẽ rất lớn. Khi đó nên dùng ANOVA: ◦ H0 : μ1 = μ2 = ... = μk = μ ◦ Ha : có ít nhất 1 giá trị μi khác những giá trị kia. Với μ là trung bình của tổng thể
  • 65. DISCRIMINANT ANALYSIS Mục đích Đặc điểm Nguyên tắc Nhận ra những Biến độc lập có Hàm phân biệt có dạng: thuộc tính (các thang metric, biến độc lập) để Y = v1.X1 + v2.X2 + v3.X3 + … biến phụ thuộc phân biệt các có thang Sau khi tính được Y, so nhóm định trước nonmetric. sánh với giá trị chuẩn Yc của biến phụ để biết đối tượng thuộc thuộc nhóm nào.
  • 66. Thí dụ: Công ty máy tính muốn biết xem thu nhập gia đình (X1) và số năm học ở trường của chủ hộ (X2) có phải là hữu ích trong việc phân biệt hộ có mua máy tính PC hay không. Khảo sát X1 và X2 của 2 nhóm mẫu ngẫu nhiên (có và không có PC). Biến độc lập: X1 – thu nhập, X2 – số năm học : metric Biến phụ thuộc: Có PC, Không có PC: category. Kết quả sẽ là hàm phân biệt: Y= v1X1 + v2X2 v1, v2 : trọng số phân biệt (hằng số) Y: điểm phân biệt So sánh Yi và Yc Phần tử i sẽ thuộc nhóm nào trong 2 nhóm mẫu trên.
  • 67. CONJOINT ANALYSIS Mục đích Áp dụng
  • 68. CONJOINT ANALYSIS Mục đích Phân tích ảnh hưởng tổng hợp (joint effects) của 2 hay nhiều biến độc lập (thang nominal) lên một biến phụ thuộc (utility score - thang đo ordinal)
  • 69. CONJOINT ANALYSIS Áp dụng Thường dùng trong test sản phẩm với nhiều yếu tố khác nhau (chất lượng, kiểu dáng, giá bán, nhãn hiệu, v.v.). Mỗi yếu tố có vài phương án khác nhau. Tìm xem tổ hợp nào được ưa thích nhất.
  • 70. CONJOINT ANALYSIS – ÁP DỤNG Nhà NC tạo ra một tập các phương án sản phẩm. Mỗi phương án là 1 tổ hợp của các yếu tố. Tập các phương án này được đưa cho đối tượng chọn/ xếp hạng (hoặc cho điểm thể hiện mức ưa thích). Conjoint analysis sẽ đánh giá ảnh hưởng của các utility score thành phần (hay part-worths, tượng trưng cho mức độ quan trọng của mỗi yếu tố) lên sự ưa thích tổng hợp (utility) đối với một sản phẩm.
  • 71. CONJOINT ANALYSIS – ÁP DỤNG Có thể dùng kết quả để Đánh giá thị phần của các nhãn hiệu trên thị trường Phân khúc thị trường Nhận dạng cơ hội thị trường cho một sản phẩm với tổ hợp thuộc tính mới
  • 72. Thí dụ: Thiết kế sản phẩm mới có 3 thuộc tính: Giá : (cao, trung bình, thấp) Kiểu dáng : (cao, trung bình, thấp) Chức năng : (đơn giản, phức tạp) ... Chỉ cần đánh giá 1 nhóm khoảng 8 tổ hợp (thay vì 18 tổ hợp) về tính hấp dẫn của sản phẩm đối với khách hàng.
  • 73. Thí dụ: Tầm quan trọng của mỗi thuộc tính Tạo ra sản phẩm có độ vị lợi cao nhất đối với Tầm quan trọng người mua. Nhà nghiên cứu của mỗi mức độ trong các thuộc tính
  • 74. Phân tích phụ thuộc Phân tích tương tác
  • 75. FACTOR ANALYSIS (PHÂN TÍCH NHÂN TỐ) Là phép rút gọn dữ liệu và biến bằng cách nhóm chúng lại với các nhân tố đại diện Điều kiện: các biến phải có thang đo metric Ứng dụng • Xây dựng bộ thang đo Multiple – item • Xác định cấu trúc bộ dữ liệu • Giảm thứ nguyên trong tập dữ liệu, rút gọn dữ liệu
  • 76. Thí dụ: Case X1 X2 X3 … … Xm Factor analysis: gom m biến 1 thành k factor 2 Tùy mục đích bài 3 toán, có thể dùng: Exploratory … factor analysis n (EFA) hoặc Confirmatory Factor 1 gồm X1 X6 X9 Xm factor analysis 2 gồm X2 X3 X10 Xm - 1 (CFA) 3 gồm X4 X5 X7 X8 ...
  • 77. CLUSTER ANALYSIS (PHÂN TÍCH NHÓM) Phân chia các đối tượng/ người thành các nhóm với các thành viên trong nhóm có các đặc trưng tương tự. Mục tiêu Thí dụ: Bài toán phân khúc thị trường (Segmentation) Phân loại hành vi mua (Typology)
  • 78. CLUSTER ANALYSIS (PHÂN TÍCH NHÓM) Quá trình thực hiện Xác định các biến làm cơ sở để phân nhóm Phần chia các nhóm dựa trên sự tương tự Đặc tên nhóm dựa theo đặc điểm chung của các thuộc tính (các biến cơ sở) Chuẩn định (Validation) và mô tả đặc trưng (profiling)
  • 79. Thí dụ: Cluster analysis để phân khúc thị trường Yêu cầu thang đo: metric Công ty TICO: Xác định các Nhóm Khách Hàng khác nhau căn cứ trên hành vi mua. “Hãy đánh giá mức độ quan trọng của các yếu tố sau đây trong quyết định mua hàng của Ông/ Bà” X1 – Chất lượng sản phẩm X2 – Giá bánX3 – Thời gian giao hàng X4 – Uy tín nhà sản xuất X5 – Các dịch vụ đi kèm Không qtrọng Rất qtrọng 1 2 3 4 5 6 7
  • 80. Thí dụ: Cluster analysis để phân khúc thị trường Hơn 300 khách hàng được khảo sát Nhận dạng ra các nhóm khác nhau. Trong mỗi nhóm có sự tương tự nhau về tầm quan trọng của các yếu tố (X1 X5) ảnh hưởng đến quyết định mua. Nhóm 1 Nhóm 1: X1, X4, X5 là quan trọng trong Khách hàng trẻ, quyết định mua thu nhập cao, ở Nhóm 2: X1, X2, X3 là quan trọng. TP... Nhóm 2 TICO sẽ có chiến lược tiếp thị đối Khách hàng với từng nhóm khách hàng khác nhau. công nghiệp – sản xuất
  • 81. MULTIDIMENTIONAL SCALING (perceptual mapping) Mục đích: Xác định số lượng và bản chất của các thứ nguyên (dimensions) đặc trưng cho nhận thức/ đánh giá của khách hàng về các đối tượng. Thang đo: Cả hai loại thang metric/nonmetric Trong MR: Thường được sử dụng trong bài toán xác định vị trí tương đối (relative position) của các nhãn hiệu cạnh tranh nhau do phản hồi từ phía khách hàng. Xác định những yếu tố đặc trưng cho việc đánh giá của khách hàng. Là phương pháp ngược với Cluster
  • 82. Multidimentional Cluster Scaling Analaysis • Phát hiện các thứ • Gộp các đối tượng nguyên đặc trưng thành các nhóm (Underlying theo 1 số đặc tính Dimensions) từ tượng tự nhau các phản hồi
  • 83.
  • 84. KỸ THUẬT ĐO VÀ THU THẬP DỮ LIỆU