Các loại sai số trong nghiên cứu Marketing

Nội dung chương này bàn đến bao gồm:

- Thế nào là giả thuyết nghiên cứu

- Các loại sai lầm khi thực hiện kiểm định giả thuyết

- Các bước giải quyết một bài toán kiểm định

- Các phương pháp kiểm định tham số

- Các phương pháp kiểm định phi tham số

Trong nghiên cứu marketing, phân tích dữ liệu luôn bao hàm kiểm định giả thuyết. Để thực hiện một kiểm định người ta phải trình bày hai giả thuyết là giả thuyết không ( thường ký hiệu H0) - giả thuyết cần kiểm định; và giả thuyết đối ( thường ký hiệu H1) - giả thuyết thay thế cho giả thuyết không để khi giả thuyết H0 bị bác bỏ thì chấp nhận giả thuyết đối H1 này. Các kỹ thuật thống kê cho phép chúng ta đi đến quyết định là các giả thuyết đó có được kiểm chứng bằng số liệu thực tế hay không.

Khi dựa vào mẫu để kiểm định giả thuyết có thể mắc hai loại sai lầm. sai lầm loại một là sai lầm khi chúng ta bác bỏ một giả thuyết đúng. Sai lầm loại hai là sai lầm khi chúng ta thừa nhận một giả thuyết sai.

Thực hiện một bài toán kiểm định bao gồm các bước: phát biểu giả thuyết không giả thuyết đối; xác định mức ý nghĩa; lựa chọn phương pháp kiểm định; tính giá trị kiểm định; xác định miền bác bỏ; đưa ra kết luận.

Thủ tục kiểm định giả thuyết có thể được sắp xếp theo hai loại chủ yếu: kiểm định tham số và kiểm định phi tham số- tuỳ thuộc vào thang đo lường của biến liên quan. Các kiểm định tham số đòi sử dụng các thang đo lường là khoảng hoặc tỷ lệ, trong khi các kiểm định phi tham số phù hợp với các thang đo lường là định danh và thứ tự. Kiểm định tham số được nghiên cứu bao gồm kiểm định tham số trung bình của tổng thể, kiểm định tham số tỷ lệ, kiểm định sự khác nhau giữa hai trung bình hai tổng thể, kiểm định sự khác nhau trung bình của nhiều tổng thể và hồi quy tương quan. Kiểm định phi tham số chúng ta sẽ nghiên cứu là kiểm định về quy luật phân phói của tổng thể, kiểm định về tính độc lập hay phụ thuộc, kiểm định dấu, kiểm định Wilcoxon, kiểm định Mann-Whitney...

Các thủ tục kiểm định đều dễ dàng và đơn giản nhờ vào sự trợ giúp của phân mềm SPSS.

Giả thiết thống kê là một giả thiết có liên quan đến một trong ba vấn đề sau:

(1) Tính độc lập hay phụ thuộc của đại lượng ngẫu nhiên cần nghiên cứu.

(2) Dạng của qui luật phân phối xác suất của đại lượng ngẫu nhiên.

(3) Giá trị của tham số của qui luật phân phối xác suất đã biết dạng.

(1) & (2) là giả thiết phi tham số và (3) là giả thiết về tham số.

Trong phần này sẽ giới thiệu phương pháp kiểm định giả thiết về tham số như tham số trung bình x trong qui luật phân phối chuẩn N(μ,σ2), tham số tỷ lệ p trong qui luật phân phối A(P), tham số chi bình phương, tham số Fisher… Trong khuôn khổ cuốn sách này, chúng tôi chỉ giới thiệu cách thức áp dụng những phương pháp kiểm định đó để giải quyết những vấn đề liên quan đến nghiên cứu tiếp thị, những vấn đề khác liên quan đến việc giải thích bản chất của các công thức có thể tham khảo thêm trong các giáo trình chuyên môn về thống kê toán.

Giả thiết cần kiểm định

Giả sử đại lượng ngẫu nhiên X cần nghiên cứu tuân theo một qui luật phân phối xác suất đã biết dạng, nhưng chưa biết giá trị của tham số θ nào đó của nó. Trên cơ sở những tin tức thu được, ta có thể giả định rằng θ = θ0, trong đó θ0 là số thực. Tất nhiên điều giả định θ = θ0 này có thể đúng hoặc có thể sai, do đó cần phải kiểm tra lại giả định đó. Từ đó ta có giả thiết cần kiểm định là {H0: θ = θ0}.

Các loại sai lầm

Chú ý rằng, vì mẫu không phải là hình ảnh chính xác của tổng thể, nên mọi mẫu chọn được đều chứa một sai số ngẫu nhiên nào đó. Do vậy, khi dựa vào mẫu để kiểm định giả thiết có thể gặp phải hai loại sai lầm sau:

- Sai lầm loại 1: Khi ta bác bỏ một giả thiết đúng.

- Sai lầm loại 2: Khi ta thừa nhận một giả thiết sai.

Trong khi tiến hành kiểm định, người ta thường ấn định trước một xác suất mức sai lầm loại 1. Nếu xác suất này bằng α, thì α được gọi là mức ý nghĩa của kiểm định (thông thường α phải khá bé, α = 0,05, α = 0,1).

Tiêu chuẩn kiểm định và miền bác bỏ

Sau khi đã đề ra giả thuyết H0 cần kiểm định kèm theo giả thiết đối H1 và qui định mức ý nghĩa α, ta cần phải tìm một thống kê T cùng qui luật phân phối xác suất của nó. Với một mức ý nghĩa α xác định, ta luôn tìm được mọi miền Wα, thỏa mãn điều kiện ()αα=∈0HWKP (xác suất để K thuộc miền miền bác bỏ Wα với điều kiện H0 đúng bằng α).

Do α khá bé, nên ta có thể coi biến cố (K∈Wα) là biến cố không thể có (với điều kiện giả thiết H0 đúng). Vì vậy, trong thực tế nếu dựa vào giá trị x của mẫu ngẫu nhiên X, ta tính được giá trị kqs của thống kê K mà lại thấy giá trị kqs∈Wα, thì điều này sẽ mâu thuẫn với điều kiện nói trên. Nguyên nhân sinh ra mâu thuẫn giữa lý thuyết và thực tế là do ta giả thiết rằng H0 đúng. Để tránh mâu thuẫn này ta phải bác bỏ giả thiết, vì thế Wα được gọi là miền bác bỏ và kqs được gọi là tiêu chuẩn kiểm định.

  1. Mô hình lựa chọn phương pháp kiểm định
    1. Các khái niệm cơ bản
    2. Tiêu chuẩn kiểm định và miền bác bỏ
    3. Các bước để giải bài toán kiểm định
  2. Các phương pháp kiểm định tham số
    1. Kiểm định giả thiết về tham số trung bình μ của tổng thể
    2. Kiểm định giả thiết tham số tỷ lệ
    3. Kiểm định sự khác nhau giữa trung bình của hai tổng thể
    4. Kiểm định sự khác nhau giữa trung bình từ hai mẫu trở lên
    5. Hồi quy tương quan
  3. Kiểm định chi bình phương về tính phụ thuộc hay độc lập của các biến
    1. Kiểm định giả thiết về quy luật phân phối của tổng thể
    2. Kiểm định chi bình phương về tính chất độc lập hay phụ thuộc (kiểm định hàng cột hay kiểm định mối quan hệ giữa hai biến biểu danh)
  4. Các phương pháp kiểm định phi tham số
    1. Kiểm định hai mẫu phụ thuộc (Dấu, Wilcoxon, Nemar)
    2. Kiểm định nhiều hơn hai mẫu phụ thuộc (Friedman, Kendall’s W, Cochran’s Q)
    3. Kiểm định cho hai mẫu độc lập (Mann-Whitney U)
    4. Kiểm định nhiều hơn hai mẫu độc lập (Kruskal-Wallis H)
  5. Xử lý dữ liệu dùng SPSS
    1. Kiểm định tham số
    2. Kiểm địn chi bình phương về tính độc lập hay phụ thuộc giữa hai biến
    3. Kiểm định phi tham số
  6. Câu hỏi ôn tập chương
  7. Tài liệu tham khảo chương

Tham khảo chi tiết ở đây.

Skip to content

Trong điều tra thống kê có hai loại sai số: Sai số chọn mẫu (sai số do tính đại diện của số liệu vì chỉ chọn một bộ phận các đơn vị để điều tra) và sai số phi chọn mẫu (sai số thuộc về lỗi của các quy định, hướng dẫn, giải thích tài liệu điều tra, do sai sót của việc cân đong, đo đếm, cung cấp thông tin, ghi chép, đánh mã, nhập tin…) từ đây gọi là “sai số điều tra”.

Sai số chọn mẫu chỉ phát sinh trong điều tra chọn mẫu khi tiến hành thu thập ở một bộ phận các đơn vị tổng thể (gọi là mẫu) rồi dùng kết quả suy rộng cho toàn bộ tổng thể. Sai số chọn mẫu phụ thuộc vào cỡ mẫu (mẫu càng lớn thì sai số càng nhỏ), vào độ đồng đều của chỉ tiêu nghiên cứu (độ đồng đều cao thì sai số chọn mẫu càng nhỏ) và phương pháp tổ chức điều tra chọn mẫu. Còn sai số điều tra xảy ra cả trong điều tra chọn mẫu và điều tra toàn bộ. Trong thực tế công tác điều tra thống kê hiện nay, phương pháp chọn mẫu được áp dụng ngày càng nhiều và có hiệu quả. Số liệu thu được từ điều tra chọn mẫu ngày càng phong phú, đa dạng và phục vụ kịp thời các yêu cầu sử dụng. Bên cạnh đó chất lượng số liệu của điều tra chọn mẫu cũng còn những hạn chế nhất định. Có một số ý kiến hiện nay đánh giá không công bằng và thiếu khách quan về kết quả điều tra chọn mẫu, cho rằng số liệu chưa sát với thực tế vì chỉ điều tra một bộ phận rồi suy rộng cho tổng thể. Tất nhiên cũng phải thấy rằng đã là điều tra chọn mẫu thì không thể tránh khỏi sai số chọn mẫu nhưng mức độ sai số chọn mẫu của phần lớn những chỉ tiêu trong các cuộc điều tra thống kê hiện nay thường là ở phạm vi cho phép nên chấp nhận được. Hơn nữa khi cần thiết ta có thể chủ động giảm được sai số chọn mẫu bằng cách điều chỉnh cỡ mẫu và tổ chức chọn mẫu một cách khoa học, tuân thủ đúng nguyên tắc chọn mẫu. Điều đáng nói và cần quan tâm hơn trong điều tra thống kê chính là sai số phi chọn mẫu. Loại sai số này xảy ra ở cả ba giai đoạn điều tra, liên quan đến tất cả các đối tượng tham gia điều tra thống kê và ảnh hưởng đáng kể đến chất lượng số liệu thống kê.

Dưới đây sẽ đi sâu nghiên cứu về sai số phi chọn mẫu – sai số điều tra, xảy ra trong cả ba giai đoạn nhưng chỉ đề cập đến sai số liên quan tới những công việc, những đối tượng thường gặp nhiều hơn.

1. Sai số trong quá trình chuẩn bị điều tra thống kê:

Trong công tác điều tra thống kê, chuẩn bị điều tra giữ một vai trò cực kỳ quan trọng. Chất lượng của khâu chuẩn bị điều tra sẽ ảnh hưởng cả đến quá trình thu thập số liệu và cuối cùng là đến chất lượng của số liệu điều tra. Một cuộc điều tra được chuẩn bị kỹ lưỡng, chu đáo và đầy đủ sẽ là cơ sở đầu tiên để giảm sai số điều tra nhằm nâng cao chất lượng của số liệu thống kê.

1.1. Sai số điều tra liên quan tới việc xác định mục đích, nội dung và đối tượng điều tra:

 Xác định mục đích điều tra là làm rõ yêu cầu của cuộc điều tra phải trả lời những câu hỏi gì, đạt được những mục tiêu nào của công tác quản lý. Yêu cầu của mục đích điều tra phải rõ ràng, dứt khoát và đó chính là căn cứ để xác định nội dung cũng như đối tượng điều tra một cách đúng đắn, đầy đủ, phù hợp, không bị chệch hướng.
Cùng một đơn vị điều tra, nếu có mục đích điều tra khác nhau với cách tiếp cận thu thập thông tin khác nhau thì sẽ có nội dung cũng như đối tượng điều tra khác nhau.

Xác định đúng nội dung và đối tượng điều tra, một mặt làm cho số liệu thu thập được sẽ đáp ứng những yêu cầu sử dụng, số liệu đảm bảo “vừa đủ”. Mặt khác, xác định đúng nội dung và đối tượng điều tra là cơ sở để thiết kế bảng hỏi một cách khoa học và có điều kiện thuận lợi để tiếp cận với đối tượng cung cấp thông tin, đảm bảo thông tin thu được phù hợp và phản ánh đúng thực tế khách quan.
Tóm lại việc xác định đúng mục đích, nội dung và đối tượng điều tra làm cho cuộc điều tra thực hiện đúng hướng, đúng yêu cầu là một trong những điều kiện tiên quyết để đảm bảo chất lượng số liệu, giảm sai số trong điều tra thống kê.

1.2. Sai số liên quan tới việc xây dựng các khái niệm, định nghĩa dùng trong điều tra:

Khái niệm, định nghĩa dùng trong điều tra giúp cho hiểu rõ nội dung, bản chất cũng như phạm vi xác định thông tin của số liệu thống kê cần thu thập.
Như ta đã biết thống kê nghiên cứu mặt lượng trong quan hệ mật thiết với mặt chất của hiện tượng kinh tế – xã hội số lớn. Chính các khái niệm, định nghĩa là phản ánh về mặt chất của hiện tượng, là cơ sở để nhận biết, phân biệt hiện tượng này với hiện tượng khác cũng như xác định phạm vi của hiện tượng nghiên cứu. Nếu khái niệm, định nghĩa chuẩn xác, rõ ràng, được giải thích đầy đủ, cặn kẽ là cơ sở để xác định và thu thập số liệu thống kê phản nh đúng thực tế khách quan. Ngược lại nếu khái niệm, định nghĩa không đúng, mập mờ, thiếu rõ ràng thì việc xác định, đo tính (lượng hoá) hiện tượng sẽ bị sai lệch.

Ví dụ: Khi điều tra cán bộ khoa học công nghệ có trình độ sau đại học, xét về chất, sau đại học phải là những người đã tốt nghiệp và có bằng thạc sĩ, tiến sĩ và tiến sĩ khoa học. Trong thực tế có cuộc điều tra thống kê ở nước ta chỉ đưa ra khái niệm sau đại học còn chung chung, thiếu cụ thể. Điều này làm cho những người tham gia điều tra (kể cả điều tra viên lẫn đối tượng trả lời) hiểu khái niệm cán bộ khoa học công nghệ có trình độ sau đại học rất khác nhau. Một số ít người đã hiểu đúng với nghĩa trình độ sau đại học phải gồm những người có bằng thạc sĩ, tiến sĩ và tiến sĩ khoa học; phần đông còn lại đã hiểu không đúng và cho là sau đại học gồm những người đã tốt nghiệp đại học sau đó được đi thực tập sinh sau đại học và thậm chí còn cả những người đã tốt nghiệp đại học nhưng chỉ được đi tập trung để đào tạo bồi dưỡng thêm về nghiệp vụ một vài tháng.

Thực tế này đã làm cho số liệu điều tra được về cán bộ khoa học công nghệ có trình độ sau đại học tăng lên hơn hai lần so với số thực tế có tại thời điểm điều tra.

Như vậy, những lỗi trong việc xây dựng các khái niệm, định nghĩa và nội dung thông tin về tiêu thức, chỉ tiêu thống kê sẽ ảnh hưởng trực tiếp đến chất lượng số liệu thống kê. Đây là hiện tượng khá phổ biến trong điều tra thống kê ở nước ta hiện nay.

Để có số liệu  tốt,    giảm          bớt       sai      số     điều tra, một vấn đề có tính chất nguyên tắc đó là         phải chuẩn hoá các khái niệm, định nghĩa về các tiêu thức, chỉ tiêu của điều tra thống kê. Đồng thời phải giải thích rõ ràng, đầy đủ và cụ thể hoá các khái niệm, định nghĩa cho phù hợp với từng cuộc điều tra riêng biệt.

1.3. Sai số điều tra liên quan tới thiết kế bảng hỏi, xây dựng các bảng danh mục và mã số dùng trong điều tra:

Trong điều tra thống kê, bảng hỏi là vật mang tin, là công cụ giúp điều tra viên điền thông tin hoặc đánh dấu, đánh mã vào các ô, dòng, cột phù hợp theo nội dung trả lời của các câu hỏi tương ứng với các tiêu thức ghi ở bảng hỏi dùng trong điều tra.

Nếu các câu hỏi phức tạp, khó hiểu, khó trả lời, khó xác định hoặc khó điền thông tin thì khi đó thông tin thu được sẽ kém chính xác, không đáp ứng yêu cầu của số liệu điều tra.

Cùng với bảng hỏi, các bảng danh mục và các mã số có vai trò quan trọng trong quá trình tổng hợp số liệu thống kê. Thông tin thu được dù đảm bảo độ tin cậy cần thiết, nhưng nếu bảng danh mục dùng cho điều tra không chuẩn xác, các mã số không rõ ràng, khó áp dụng dẫn tới việc đánh sai, đánh nhầm và tất nhiên như vậy số liệu tổng hợp sẽ bị sai lệch.

Để giảm sai số điều tra, bảng hỏi phải được thiết kế một cách khoa học, đáp ứng đầy đủ nhu cầu thông tin theo nội dung điều tra đã được xác định, bảo đảm mối liên hệ logic và tính thống nhất giữa các câu hỏi. Mặt khác, các câu hỏi phải đơn giản, dễ hiểu, dễ trả lời, dễ ghi chép, phù hợp với trình độ của điều tra viên và đặc điểm về nguồn thông tin của từng loại câu                 hỏi. Thiết kế          bảng            hỏi     còn phải     đảm       bảo  thuận lợi cho việc áp  dụng công nghệ thông tin. Các bảng danh mục phải có nội dung phù hợp với những thông tin cần thu thập và được mã hoá một cách khoa học theo yêu cầu tổng hợp của điều tra. Danh mục vừa phải phù hợp với yêu cầu của từng cuộc điều tra, vừa phải đáp ứng và thống nhất với danh mục phục vụ cho tổng hợp chung      của công tác thống kê. Nội dung bảng danh  mục        và cách mã hoá phải được giải thích đầy đủ và hướng dẫn cụ thể.

1.4. Sai số điều tra liên quan tới việc lựa chọn điều tra viên và hướng dẫn nghiệp vụ:

Điều tra viên là người trực tiếp truyền đạt mục đích, nội dung, yêu cầu điều tra đến các đối tượng cung cấp thông tin, đồng thời trực tiếp phỏng vấn, lựa chọn thông tin để ghi vào bảng hỏi (nếu là điều tra trực tiếp). Vì vậy, điều tra viên có vai trò rất quan trọng trong việc đảm bảo chất lượng số liệu trong điều tra.

Nếu điều tra viên không nắm vững mục đích của cuộc điều tra, không hiểu hết nội dung thông tin cần thu thập thì sẽ truyền đạt không đúng các yêu cầu cần thiết cho đối tượng trả lời. Ngay cả khi điều tra viên nắm được nghiệp vụ, nhưng nếu thiếu ý thức trách nhiệm, chỉ phỏng vấn và ghi chép cho xong việc, hoặc cách tiếp cận với đối tượng điều tra không tốt thì cũng sẽ dẫn đến kết quả số liệu điều tra thu được không theo ý muốn.

Như vậy, việc lựa chọn điều tra viên không tốt cũng là nguyên nhân không kém phần quan trọng làm cho sai số điều tra tăng lên, ảnh hưởng đến chất lượng số liệu. Vì vậy, muốn giảm bớt loại sai số điều tra này, cần tuyển chọn điều tra viên có trình độ nhất định, nắm được nghiệp vụ, có kinh nghiệm thực tế về điều tra thống kê, đồng thời phải có ý thức và tinh thần trách nhiệm cao.

Sau khi                   lựa chọn được                       điều        tra viên               cần tổ             chức          tập       huấn         nghiệp             vụ      đầy        đủ và            thống nhất. Trong lớp tập huấn bên cạnh giải thích biểu mẫu điều tra cần cung cấp thêm những kiến thức về xã hội, phổ biến những kinh nghiệm thực tế và cách tiếp cận đối tượng điều tra, cách ứng  xử trong thực tế. Đối             với                                                                 các cuộc                             điều        tra      thống kê có                   nội       dung phức tạp                        và quy mô lớn, cần tiến hành điều tra thử để kịp thời rút kinh nghiệm, đảm bảo hướng dẫn nghiệp vụ gắn với điều tra thực địa.

Trong điều tra chọn mẫu, khi hướng dẫn nghiệp vụ cần chỉ rõ lộ trình điều tra theo từng cấp chọn mẫu, xác định địa bàn điều tra, lập danh sách địa bàn và đối tượng điều tra chọn mẫu (có địa chỉ cụ thể), quy định rõ những trường hợp mất mẫu phải thay đổi như thế nào, thay đổi đến đâu để tránh tình trạng điều tra viên thay đổi mẫu tuỳ tiện theo ý chủ quan của họ, v.v…

2. Sai số trong quá trình tổ chức điều tra:

2.1. Sai số điều tra liên quan đến quan hệ giữa yêu cầu về nội dung thông tin và quỹ thời gian, các điều kiện vật chất cần cho thu thập số liệu:

Nếu trong các cuộc điều tra thống kê phải thu thập quá nhiều chỉ tiêu có nội dung thông tin phức tạp, tốn nhiều thời gian để giải thích, phỏng vấn và ghi chép; trong khi đó quỹ thời gian và kinh phí dành cho công việc này lại không tương xứng, làm cho điều tra viên không đủ điều kiện để tiếp cận tìm hiểu tình hình thực tế, giải thích một cách đầy đủ, cặn kẽ về mục đích, yêu cầu và nội dung điều tra, …, cho người cung cấp thông tin thì có thể họ sẽ không khai báo, hoặc khai báo qua loa, sai với thực tế. Đặc biệt có những loại thông tin phải hồi tưởng thì càng không đủ thời gian để nhớ lại. Tất cả những điều đó làm cho số liệu thu thập được sai số nhiều, không phản ánh đúng thực tế khách quan.

Để nâng cao                         chất lượng số liệu thống                                       kê,        giảm          sai số           khi       tổ      chức          điều tra,              phải        cân đối

giữa nhu cầu                         thu thập thông tin                              với       khả        năng          về       điều        kiện         kinh phí và                    quỹ       thời gian dành cho điều tra. Không nên tổ chức một cuộc điều tra đòi hỏi thu thập quá nhiều chỉ tiêu; đặc biệt phải giới hạn những chỉ tiêu thu thập quá khó và tính toán phức tạp. Hơn nữa tuỳ thuộc vào đặc điểm và nội dung thông tin của các chỉ tiêu khác nhau, thuộc các đối tượng khác nhau để có cách tiếp cận thu thập thông tin cho hợp lý. Có thể chỉ tiêu này cần thu thập từ những nội dung chi tiết rồi tổng hợp chung lại, nhưng chỉ tiêu kia chỉ cần lấy số liệu khái quát. Không nên cho           rằng                        bất       kỳ                                                             chỉ             tiêu nào, nội       dung thông tin nào               cũng                                                                            phải        lấy       từ số liệu chi tiết mới là chính xác.

2.2. Sai số điều tra liên quan đến điều tra viên:

Như trên                    đã    nói để nâng cao chất lượng                                              số       liệu,         giảm sai                số     điều tra, một                       trong           những yêu cầu là phải chọn những người điều tra đủ tiêu chuẩn về chuyên môn và tinh thần trách nhiệm.

Ngoài những yêu cầu trên, điều tra viên khi được phân công về địa bàn điều tra, còn đòi hỏi phải làm quen với địa bàn, tìm hiểu thực tế về phong tục, tập quán, về điều kiện đi lại, sinh hoạt của địa phương.

Khi điều tra, điều tra viên phải kết hợp được kiến thức chuyên môn về điều tra đã được hướng dẫn với tình hình thực tế ở địa bàn điều tra, vừa phải giữ đúng nguyên tắc quy định cho điều tra, vừa phải có được những xử lý linh hoạt và hài hoà. Phần lớn những thắc mắc của đối tượng điều tra, điều tra viên phải tự mình tìm ra hướng giải đáp. Chỉ những trường hợp cần thiết mới ghi lại để xin ý kiến về cách xử lý của cấp chỉ đạo cao hơn.

2.3. Sai số điều        tra liên quan đến ý thức, tâm lý và khả năng hiểu biết của người trả lời:

Ở đây việc trả       lời       câu       hỏi       có thể không tốt      do ba nguyên nhân thuộc  người cung cấp thông tin như sau:

  • Về ý thức của người trả lời: Nếu họ không có tinh thần trách nhiệm cao, cho là cung cấp thông tin thế nào cũng được, nói cho xong việc thì có thể khi điều tra, người cung cung cấp thông tin sẽ lấy lý do này, lý do khác để không trả lời hoặc trả lời không hết, không đúng sự thật. Không ít trường hợp người trả lời còn cố tình khai không đúng vì lợi ích kinh tế và mục đích khác.
  • Về tâm lý, nhiều người cung cấp thông tin không muốn trả lời những câu hỏi liên quan đến đời          tư,                               đến mức        sống,    đến sự bí               mật kín          đáo                              của họ, của                      đơn vị họ. Ví          dụ:             khi                      điều tra thu thập thông tin mức thu                                               nhập        của hộ            gia        đình,         phần lớn các                      chủ hộ            nhất        là những                người có thu nhập cao thường không muốn nói thật, nói hết mức thu nhập của mình. Một ví dụ khác một người phụ nữ đi phá thai trong trường hợp giấu gia đình họ sẽ không muốn khai vì không muốn cho những người thân trong gia đình biết đến.
  • Về nhận thức của người trả lời, nhiều người do nhận thức có hạn, không thấy rõ được mục đích, yêu cầu điều tra, không hiểu được nội dung câu trả lời… do vậy họ không thể trả lời hoặc trả lời không đúng với yêu cầu câu hỏi.

Qua đây cho thấy, để giảm bớt sai số điều tra, điều tra viên phải có cách tiếp cận hợp lý với từng loại đối tượng điều tra, ngoài kiến thức chuyên môn còn phải hiểu biết về xã hội, giải thích cho người được phỏng vấn về mục đích, ý nghĩa, về nguyên tắc cung cấp và bảo mật thông tin riêng, về trách nhiệm và quyền hạn của người cung cấp thông tin, giải thích cho họ hiểu nội dung câu hỏi một cách thuận tiện nhất, gợi ý cho họ những cách trả lời để đi đến có được số liệu thật.

2.4. Sai số điều tra liên quan đến các phương tiện cân, đong, đo lường:

Tất cả các khâu khác chuẩn  bị    tốt,  nhưng  nếu các   loại  phương tiện như cân, thước đo, dụng cụ đo huyết áp… dùng cho các chỉ tiêu phải thực hiện kiểm tra, đo, đếm trực tiếp mà không được chuẩn bị tốt thì cũng sẽ sai sót dẫn đến sai số trong điều tra. Ví dụ: điều tra để xác định mức độ suy dinh dưỡng của trẻ em. Nếu ta dùng loại cân không chuẩn thì sẽ cân không chính xác, dẫn đến số liệu tổng hợp về tỷ lệ trẻ em suy dinh dưỡng sẽ không đúng, hoặc là cao hơn, hoặc là thấp hơn thực tế.

Như vậy, việc chuẩn bị tốt các phương tiện đo lường, sử dụng đơn vị đo lường tiêu chuẩn, tránh sử dụng đợn vị đo lường địa phương khi điều tra cũng là biện pháp cần thiết để giảm sai số điều tra.

3. Sai số liên quan đến quá trình xử lý thông tin:

Sai số điều tra còn có thể xảy ra vì sai sót trong khâu đánh mã, nhập tin trong quá trình tổng hợp, xử lý số liệu.

Số liệu thu về phải được kiểm tra sơ bộ trước khi đánh mã, nhập thông tin. Việc kiểm tra này có thể phát hiện ra những trường hợp hiểu đúng nhưng ghi chép sai như nhầm đơn vị tính: 1 cái ghi sai thành 1 ngàn cái, 1 đồng thành 1 ngàn đồng; điền sai vị trí của thông tin, v.v. Bằng kinh nghiệm nghề nghiệp cũng như quan hệ logic tính toán giữa các câu hỏi, người kiểm tra có thể phát hiện được những loại sai sót kiểu này. Kiểm tra sơ bộ còn có thể phát hiện những trường hợp có “số liệu lạ” (quá cao hoặc quá thấp so với mức bình quân chung). Những loại sai sót trên đây nhân viên kinh tế có thể tự điều chỉnh hoặc nếu trong những trường hợp cần thiết phải kiểm tra xác minh lại. Làm tốt khâu kiểm tra sơ bộ cũng là công việc góp phần quan trọng để giảm sai số điều tra.

Cần kiểm tra sơ bộ công đoạn đánh mã và nhập thông tin. Số liệu ghi đúng, ghi đầy đủ được kiểm tra kỹ lưỡng, nhưng nếu đánh mã sai, hoặc nhập thông tin sai thì cũng dẫn đến kết quả tổng hợp sai.

Sai sót trong đánh mã có thể là lựa chọn mã không phù hợp với nội dung của thông tin, hoặc là do bảng mã không cụ thể, khó xác định, hoặc là khả năng liên hệ vận dụng mã của người đánh mã không tốt; , đánh mã sai (mã này lẫn với mã kia) hoặc có mã đúng nhưng lộn số (ví dụ 51 thành 15), v.v…

Để khắc phục sai sót trong khâu đánh mã, trước hết phải có bảng mã tốt, cụ thể, phù hợp với nội dung thông tin cần thu thập. Bên cạnh những mã cụ thể cần có những mã chung để cho người đánh mã có cơ sở vận dụng cho những trường hợp thực tế xảy ra nhưng chưa có mã trong danh mục mã cụ thể (gọi là các trường hợp khác). Mặt khác, người đánh mã phải được hướng dẫn đầy đủ về yêu cầu, nguyên tắc và kỹ thuật đánh mã, khi thực hiện phải biết vận dụng và xử lý linh hoạt nhưng tuyệt đối không được tuỳ tiện, người đánh mã còn kết hợp chặt chẽ với các bộ phận khác trong cùng khâu tổng hợp, xử lý số liệu.

Sau đánh mã là khâu nhập thông tin và khâu này cũng thường xuyên xảy ra sai số. Loại sai sót này thường xảy ra trong các trường hợp sau: Nhập tin đúp hoặc bỏ qua không nhập thông tin, nhập mã sai, ấn lộn số, v.v…

Để khắc phục những sai sót khi nhập tin, thông trước hết phải lựa chọn những nhân viên nhập tin có khả năng nhập tốt, ít nhầm lẫn, có tinh thần trách nhiệm cao, tuân thủ nghiêm túc những quy trình và nguyên tắc nhập thông tin đã được hướng dẫn thống nhất.

Trên góc độ công nghệ thông tin, phải có chương trình nhập hợp lý, khoa học, có được những lệnh cho phép tự kiểm tra để phát hiện những lỗi nhập thông tin.

Trong nhiều trường hợp phải phân công chéo để nhập thông tin hai lần rồi so sánh đối chiếu số  liệu   nhập  để tìm ra những    trường  hợp   khôngthống nhất thuộc   về  lỗi nhập thông tin.

Đối với các cuộc điều tra thống kê thực tế hiện nay, những lỗi nhập thông tin ảnh hưởng đến sai số điều tra không phải là nhỏ. Tuy nhiên, sai số do lỗi nhập thông tin, nếu có chuẩn bị tốt hoàn toàn có khả năng khắc phục.