Lý thuyết: Thông tin và dữ liệu

1. Khái niệm về Thông tin và Dữ liệu

– Thông tin là một khái niệm trừu tượng mà ta có thể hiểu như sự truyền đạt, trao đổi hay giải thích về một đối tượng nào đó. Thông tin thường được biểu đạt dưới dạng tín hiệu như chữ số, chữ viết, âm thanh hay dòng điện. Ví dụ, thông tin về kết quả học tập của học sinh mà giáo viên ghi trong sổ liên lạc giúp phụ huynh hiểu về tình hình học tập của con em mình.

Một cách tổng quát, thông tin là kiến thức mà con người hiểu về một thực thể nào đó và có thể thu thập, lưu trữ và xử lí được.

– Dữ liệu cũng là một khái niệm trừu tượng, đại diện cho thông tin đã được nhập vào máy tính. Sau khi được thu thập và xử lí, dữ liệu sẽ trở thành thông tin. Ví dụ, số điểm thi là một dữ liệu, nhiệt độ trong một ngày cũng là một dữ liệu, hình ảnh về con người hay cảnh vật cũng được coi là dữ liệu.

2. Đơn vị đo lường của Thông tin

Đơn vị cơ bản để đo lường thông tin là bit (Binary digit). Bit là đơn vị nhỏ nhất của thông tin có thể biểu diễn bằng hai ký hiệu 0 và 1. Hai ký hiệu này được sử dụng để biểu diễn thông tin trong máy tính.

Ngoài bit, chúng ta còn sử dụng đơn vị đo thông tin khác như byte, một byte tương ứng với 8 bit. Dưới đây là các đơn vị đo thông tin thường sử dụng:

Có Thể Bạn Quan Tâm :   CURL là gì? Cách sử dụng Curl

1 byte = 8 bit

1 kilobyte (kB) = 1024 byte = 210 byte

1 megabyte (MB) = 1024 kB = 210 kB

1 gigabyte (GB) = 1024 MB = 210 MB

1 terabyte (TB) = 1024 GB = 210 GB

1 petabyte (PB) = 1024 TB = 210 TB

3. Các dạng thông tin

Chúng ta có thể phân loại thông tin thành hai loại: thông tin số (bao gồm số nguyên, số thực…) và thông tin phi số (văn bản, âm thanh, hình ảnh…)

4. Quá trình mã hoá thông tin trong máy tính

Để máy tính có thể xử lí thông tin, thông tin phải được biến đổi thành dạng bit. Quá trình biến đổi như vậy được gọi là mã hoá thông tin.

Để mã hoá thông tin dạng văn bản, chúng ta sử dụng bộ mã ASCII, trong đó mỗi ký tự được biểu diễn bằng 8 bit. Bộ mã ASCII gồm các ký tự được đánh số từ 0 đến 255, và chúng được gọi là mã ASCII thập phân của ký tự.

Trong khi đó, bộ mã Unicode sử dụng 16 bit để mã hoá thông tin vì bộ mã ASCII chỉ đủ để mã hoá 256 ký tự, không đủ để mã hoá tất cả các bảng chữ cái của các ngôn ngữ trên thế giới. Bộ mã Unicode có thể mã hoá 65536 ký tự khác nhau, đồng thời cho phép hiển thị văn bản của hầu hết các ngôn ngữ bằng một bộ mã duy nhất. Đây là bộ mã được sử dụng rộng rãi để biểu diễn các văn bản quốc tế.

Có Thể Bạn Quan Tâm :   Tất toán là gì? Các hình thức tất toán? Quy trình tất toán như thế nào?

Thông tin bất kể dạng như thế nào, khi được lưu trữ và xử lí trong máy tính, đều được biểu diễn dưới dạng mã nhị phân.

5. Biểu diễn thông tin trong máy tính

a) Biểu diễn thông tin số

– Hệ đếm: Hệ đếm được hiểu như một tập hợp các ký hiệu và quy tắc sử dụng các ký hiệu đó để biểu diễn và xác định giá trị của các số. Có hai loại hệ đếm phổ biến là hệ đếm phụ thuộc vị trí và hệ đếm không phụ thuộc vị trí.

Hệ đếm La Mã là một hệ đếm không phụ thuộc vị trí, trong đó các chữ cái được sử dụng để biểu diễn giá trị của số: I=1; V=5; X=10; L=50; C=100; D=500; M=1000. Hệ đếm La Mã thường được sử dụng để đánh số các chương, mục hay đánh thứ tự.

Ngoài ra, có các hệ đếm phủ thuộc vị trí, trong đó bất kỳ số tự nhiên nào lớn hơn 1 cũng có thể chọn làm cơ số cho hệ đếm. Số lượng các ký hiệu được sử dụng trong hệ đếm phụ thuộc vào cơ số của hệ đếm đó và các ký hiệu có giá trị tương ứng từ 0 đến b-1, trong đó b là cơ số của hệ đếm.

i) Hệ thập phân (hệ cơ số 10) sử dụng tập ký hiệu gồm 10 chữ số: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. Giá trị của mỗi chữ số phụ thuộc vào vị trí của nó trong biểu diễn.

Có Thể Bạn Quan Tâm :   Lập trình nhúng là gì? Lộ trình trở thành kỹ sư lập trình nhúng - ITNavi

ii) Các hệ đếm thường sử dụng trong lĩnh vực Tin học

– Hệ nhị phân (hệ cơ số 2) chỉ sử dụng hai ký hiệu: số 0 và số 1.

Ví dụ: 1012 = 1×22 + 0x21 + 1×2° = 510.

– Hệ thập lục phân (hệ Hexa) sử dụng các ký hiệu: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F. Trong đó, các ký hiệu A, B, C, D, E, F tương ứng với 10, 11, 12, 13, 14, 15 trong hệ thập phân.

iii) Biểu diễn số nguyên

Một byte có thể biểu diễn các số nguyên trong phạm vi từ -127 đến 127.

iv) Biểu diễn số thực

Sử dụng dấu chấm (.) để ngăn cách giữa phần nguyên và phần thập phân. Mọi số thực đều có thể biểu diễn dưới dạng ±M x 10^K (gọi là dạng dấu phẩy động).

b) Biểu diễn thông tin phi số

– Biểu diễn văn bản: Một ký tự được biểu diễn bằng một dãy bit (là mã ASCII của ký tự đó).

– Các dạng thông tin khác: Âm thanh, hình ảnh,… cũng được biểu diễn bằng dãy bit.

– Nguyên tắc mã hoá nhị phân

Thông tin có thể có các dạng khác nhau như số, văn bản, hình ảnh, âm thanh,… Khi được nhập vào máy tính, tất cả đều biến đổi thành dạng chung là một dãy bit. Dãy bit là biểu diễn nhị phân của thông tin đó.

Loigiaihay.com

Back to top button