Đôi khi trong tập dữ liệu, chúng ta gặp các cột chứa các số không có thứ tự ưu tiên cụ thể. Dữ liệu trong cột thường biểu thị một danh mục hoặc giá trị của danh mục và cả khi dữ liệu trong cột được mã hóa nhãn. Điều này gây nhầm lẫn cho mô hình ML, để tránh điều này, dữ liệu trong cột phải được mã hóa One Hot. One Hot. Show Nội dung chính Show
Nó đề cập đến việc chia nhỏ cột chứa dữ liệu phân loại số thành nhiều cột tùy thuộc vào số lượng danh mục có trong cột đó. Mỗi cột chứa “0” hoặc “1” tương ứng với cột mà nó đã được đặt. Ví dụ : Xem xét dữ liệu mà trái cây và giá trị phân loại tương ứng của chúng được đưa ra. FRUITCATEGORICAL VALUE OF FRUITPRICEapple15mango210apple115mango320orange One Hot) dữ liệu được đưa ra như sau, Đầu ra sau một lần mã hóa nóng(One Hot) dữ liệu được đưa ra như sau,APPLEMANGOPRICE10050101010015001202. Dưới đây là Triển khai bằng Python3. Để một mã hóa nóng cột vùng 4. Mã hóa Nhãn dữ liệu
Output: 3. Để một mã hóa nóng cột vùng
4. Mã hóa Nhãn dữ liệu Nó đề cập đến việc chia nhỏ cột chứa dữ liệu phân loại số thành nhiều cột tùy thuộc vào số lượng danh mục có trong cột đó. Mỗi cột chứa “0” hoặc “1” tương ứng với cột mà nó đã được đặt. Ví dụ : Xem xét dữ liệu mà trái cây và giá trị phân loại tương ứng của chúng được đưa ra. FRUIT CATEGORICAL VALUE OF FRUIT4. Mã hóa Nhãn dữ liệu 4. Mã hóa Nhãn dữ liệuMã hóa Nhãn dữ liệu
4. Mã hóa Nhãn dữ liệu Nó đề cập đến việc chia nhỏ cột chứa dữ liệu phân loại số thành nhiều cột tùy thuộc vào số lượng danh mục có trong cột đó. Mỗi cột chứa “0” hoặc “1” tương ứng với cột mà nó đã được đặt.
4. Mã hóa Nhãn dữ liệu Nó đề cập đến việc chia nhỏ cột chứa dữ liệu phân loại số thành nhiều cột tùy thuộc vào số lượng danh mục có trong cột đó. Mỗi cột chứa “0” hoặc “1” tương ứng với cột mà nó đã được đặt. Ví dụ :
CATEGORICAL VALUE OF FRUITmọi lúc mọi nơi tại đây. PRICE
mango
Ví dụ 1:
Kết quả bao gồm 5 cột, 2 cột đại diện cho giới tính, nam và nữ, 3 cột còn lại đại diện cho các quốc gia Pháp, Đức và Tây Ban Nha. |