Tổng quan về biểu đồ Histogram cụ thể nhất

0
177

Biểu đồ Histogram là một trong những công cụ toán học, thống kê được ứng dụng nhiều nhất trong đời sống. Vậy cách xác định biểu đồ này ra sao, ứng dụng của biểu đồ như thế nào sẽ được đề cập qua nội dung bài viết sau!

1. Khái niệm về biểu đồ Histogram

Biểu đồ Histogram là biểu đồ về tần số của các giá trị của một biến được sử dụng phổ biến trong toán học và xác suất thống kê. Nói cách khác, biểu đồ cho chúng ta biết tần suất xuất hiện các giá trị khác nhau của một biến trong dữ liệu. 

Biểu đồ thường được mô tả bằng một loạt các thanh được sắp xếp dọc theo trục x (đại diện cho các giá trị của biến) với độ dài của các thanh được hiển thị dọc theo trục y (đại diện cho tần suất của các giá trị).

Biểu đồ là một biểu diễn đồ họa của sự phân bố dữ liệu, là ước tính về phân phối xác suất của một biến liên tục. Biểu đồ Histogram thường ở dạng biểu đồ thanh và được Karl Pearson giới thiệu lần đầu tiên vào năm 1891.

Bước đầu tiên trong việc tạo biểu đồ là chia toàn bộ phạm vi giá trị thành một loạt các khoảng được gọi là “thùng” và sau đó “thả” các giá trị riêng lẻ vào các thùng mà chúng thuộc về. Chiều rộng của thùng được xác định bởi phạm vi và có có thể giống hoặc khác nhau. 

Nếu các thùng có chiều rộng bằng nhau, thì chiều cao hoặc trục thẳng đứng của thanh xác định tần suất xuất hiện của tập hợp đó. Nhưng nếu các thùng không có chiều rộng bằng nhau, thì diện tích của thanh hoặc hình chữ nhật biểu thị tần suất xuất hiện trong khi trục tung thể hiện mật độ. 

Trong cả hai trường hợp, tất cả các thanh trong biểu đồ chạm vào để biểu thị rằng biến hoặc dữ liệu là liên tục.

Histogram – biểu đồ được ứng dụng phổ biến nhất

Histogram – biểu đồ được ứng dụng phổ biến nhất

2. Ý nghĩa

Biểu đồ có thể được sử dụng để trực quan hóa dữ liệu hoặc hiện tượng với cả yếu tố liền kề và yếu tố xảy ra. Biểu đồ có thể ứng dụng trong các trường hợp :

Sử dụng để đặt mục tiêu

Dựa vào việc xây dựng biểu đồ có thể chọn giảm mức độ biến động trung bình và cực đoan trong quy trình, đưa quy trình trở lại tuân thủ các yêu cầu hiện tại hoặc mới.

Thể hiện năng lực của quy trình 

Nếu các yêu cầu của khách hàng có sẵn, chúng có thể được vẽ trên biểu đồ để cho biết mức độ sản phẩm, dịch vụ hoặc điểm kiểm tra không đáp ứng yêu cầu.

Phân tầng dữ liệu 

Khi các yếu tố phân tầng dữ liệu được cho là gây ra sự thay đổi (cái gì, khi nào, ở đâu và ai) thì nguyên nhân chính của sự khác biệt trở nên dễ phát hiện hơn.

Xác nhận kết quả

Bằng cách so sánh biểu đồ trước và sau khi các biện pháp đối phó được thực hiện, sự thay đổi trong phân phối dữ liệu có thể cho thấy hiệu quả trong việc tấn công các nguyên nhân gốc rễ của vấn đề.

So sánh kết quả 

Bằng cách so sánh tỷ lệ năng suất của hai người vận hành sử dụng cùng một máy trong các ca làm việc khác nhau, hoặc hai bác sĩ có tỷ lệ bệnh nhân xuất viện khác nhau hoặc độ tin cậy của thiết bị của hai nhóm bảo trì khác nhau, biểu đồ có thể cho chúng ta cái nhìn sâu sắc mà chúng ta cần để xác định vấn đề quan trọng.

3. Các dạng biểu đồ Histogram

* Biểu đồ phân phối chuẩn

Trong phân phối chuẩn, các điểm ở một phía của mức trung bình có khả năng xảy ra như ở phía bên kia của mức trung bình.

Biểu đồ phân phối chuẩn

* Biểu đồ dạng một phân phối hai phương thức 

Trong một phân phối hai phương thức, có hai đỉnh. Trong phân phối hai phương thức, dữ liệu nên được tách biệt và phân tích như các phân phối chuẩn riêng biệt.

Biểu đồ dạng một phân phối hai phương thức 

* Biểu đồ phân phối lệch phải

Phân phối lệch phải còn được gọi là phân phối lệch dương. Trong phân phối lệch phải, một số lượng lớn giá trị dữ liệu xảy ra ở phía bên trái với số lượng giá trị dữ liệu ít hơn ở phía bên phải. Phân phối lệch phải thường xảy ra khi dữ liệu có ranh giới phạm vi ở phía bên trái của biểu đồ. Ví dụ, biểu đồ có một bên ranh giới của 0.

Biểu đồ phân phối lệch phải

* Biểu đồ phân phối lệch trái 

Phân phối lệch trái còn được gọi là phân phối lệch âm. Trong phân phối lệch trái, một số lượng lớn giá trị dữ liệu xảy ra ở phía bên phải và số lượng giá trị dữ liệu ở phía bên trái ít hơn. Phân phối lệch phải thường xảy ra khi dữ liệu có ranh giới phạm vi ở phía bên phải của biểu đồ. Ví dụ biểu đồ có một bên ranh giới có giá trị 100.

Biểu đồ phân phối lệch trái

* Biểu đồ phân phối ngẫu nhiên

Một phân phối ngẫu nhiên không có mẫu rõ ràng và có một số đỉnh. Trong biểu đồ phân phối ngẫu nhiên, có thể xảy ra trường hợp các thuộc tính dữ liệu khác nhau được kết hợp. Do đó, dữ liệu nên được tách biệt và phân tích riêng biệt.

Biểu đồ phân phối ngẫu nhiên

4. Các bước vẽ biểu đồ Histogram

Bước 1: Tổng hợp số liệu, các số liệu được tổng hợp ngẫu nhiên và tối thiểu là 65 giá trịz.

Bước 2: Xác định giới hạn R bằng cách tính chênh lệch của giá trị Max và giá trị Min.

Bước 3: xác định cột K và độ rộng W của biểu đồ. Chỉ cần căn bậc 2 của giá trị và lấy phần nguyên nếu kết quả ra số lẻ.

Bước 4: Quy định các giá trị trên và dưới của mỗi cột một cách lần lượt.

Bước 5: Tính tần suất.

Bước 6: Vẽ biểu đồ.

5. Cách đọc biểu đồ Histogram

Để đọc biểu đồ Histogram một cách chính xác chúng ta có thể áp dụng trong một ví dụ cụ thể sau đây:

Cách đọc biểu đồ Histogram

Đây là biểu đồ thể hiện mức thu nhập của 5 nhóm tuổi đã được thống kê tại một quốc gia.

Như vậy nhìn vào biểu đồ chúng ta thấy nó thể hiện mức có thu nhập cao nhất là trong độ tuổi từ 45-54 và thu nhập thấp nhất ở nhóm tuổi 65-74.

Như vậy để đọc chính xác biểu đồ chúng ta cần xác định được tên của các cột giá trị. Con số biểu diễn trong cột giá trị đã được thể hiện và dựa vào chiều cao để nhận xét tính chất của đối tượng mà biểu đồ đang thể hiện.

Biểu đồ Histogram không chỉ sử dụng trong toán học và thống kê và được áp dụng trong nhiều trường hợp để phân tích thị trường, độ ảnh hưởng của một tiêu chí bất kỳ. Quy trình xây dựng nên biểu đồ khá đơn giản nên có thể áp dụng rộng rãi trong nhiều trường hợp. Hy vọng với các thông tin được chia sẻ, bạn đọc sẽ hiểu và áp dụng để phân tích cho cá cyếu tố cần kiểm kê một cách hiệu quả nhất