Quá trình số hoá (digitizing) một tín hiệu analog gồm 4 bước:
1. Quá trình lấy mẫu (Sampling)
Tín hiệu Analog có dạng hình Sin. Và tần số âm thanh cho phép trên đường truyền trong khoảng từ 300 đến 3400 Hz. Tuy nhiên trong thực tế sẽ có một ít năng lượng nhiễu được chuyển qua dưới dạng các tần số cao hơn tần số 3400Hz. Theo lý thuyết Nyquist: tần số sẽ được lấy mẫu khoãng 8000 lần trên 1 giây.
2. Quá trình lượng tử hóa (Quantization)
Tiến trình kế tiếp của số hóa tín hiệu là biểu diễn giá trị chính xác cho mỗi mẫu được lấy. Mỗi mẫu có thể được gán cho một giá trị số, tương ứng với biên độ (theo chiều cao) của mẫu.
Biên độ chiều cao tối đa của mẫu trong khoãng 0 -> 127 (gọi là Positive) và 0 -> -127 (gọi là Negative). Mẫu sau khi lấy được chia thành 8 bits. Trong đó, bit đầu tiên sẽ được biểu diễn là 0 hoặc 1 dựa vào biên độ “Dương (+) sẽ là 1 ;Âm (-) sẽ là 0” và 7 bits còn lại biểu diễn cho độ lớn.
Sau khi thực hiện giới hạn đầu tiên đối với biên độ tương ứng với dải mẫu, đến lượt mỗi mẫu sẽ được so sánh với một tập hợp các mức lượng tử và gán vào một mức xấp xỉ với nó. Qui định rằng tất cả các mẫu trong cùng khoảng giữa hai mức lượng tử được xem có cùng giá trị. Sau đó giá trị gán được dùng trong hệ thống truyền. Sự phục hồi hình dạng tín hiệu ban đầu đòi hỏi thực hiện theo hướng ngược lại.
Qui định rằng tất cả các mẫu trong cùng khoảng giữa hai mức lượng tử được xem có cùng giá trị. Sau đó giá trị gán được dùng trong hệ thống truyền. Quá trình lấy mẫu được thực hiện sau mỗi 8000 lần/giây. Mỗi lượng tử có giá trị là 8 bits. 8000 x 8 = 64000 bits. Tương đương 64 kb/s được cho phép trên đường truyền.Sự phục hồi hình dạng tín hiệu ban đầu đòi hỏi thực hiện theo hướng ngược lại.
3. Quá trình mã hóa (Encoding)
Mỗi mức lượng tử được chi định một giá trị số 8 bit, kết hợp 8 bit lại có 256 mức hay giá trị. Bit đầu tiên được quy ước cho việc đánh dấu giá trị âm hoặc dương cho mẫu. Bảy bit còn lại được biểu diễn cho độ lớn, bit đầu tiên chỉ nửa trên hay nửa dưới của dãy, bit thứ hai chỉ phần tư trên hay dưới, bit thứ 3 chỉ phần tàm trên hay dưới và cứ thế tiếp tục.
Ba bước tiến trình này sẽ lặp lại 8.000 lần mỗi giây cho dịch vụ kênh thoại, Dùng bước thứ tư là tùy chọn để nén hay tiêt kiệm băng thông. Với tùy chọn này thì một kênh có thể mang nhiều cuộc gọi đồng thời.
4. Quá trình nén giọng nói (Voice Compression)
Để có thể truyền các gói tin âm thanh một cách hiệu quả, tiết kiệm băng thông và đảm bảo cân bằng tải cho các dịch vụ khác trong mạng LAN/WAN, Người xây đựng mô hình mạng phải cân nhắc kĩ đến vấn đề lựa chọn giao thức đóng gói. Mặc dù kỹ thuật mã hóa PCM 64 Kbps hiện hành là phương pháp được chuẩn hóa, nhưng có vài phương pháp mã hóa khác được sử dụng trong những ứng dụng đặc biệt.
Các phương pháp này thực hiện mã hóa tiếng nói với tốc độ nhỏ hơn tốc độ của PCM, nhờ đó mà tận dụng được khả năng của hệ thống truyền dẫn số. Vì vậy, các mã hóa tốc độ thấp này sẽ bị hạn chế về chất lượng, đặc biệt là nhiễu méo tần số.
- Một số ví dụ hệ thống mã hóa tiếng nói tốc độ thấp:
• CVSD (Continously variable slope delta modulaton) – Kỹ thuật điều chế dựa trên sự chênh lệch trong biến đổi của tín hiệu liên tục: kỹ thuật này là một dẫn xuất của điều chế dựa trên sự chênh lệch (delta), trong đó một bit đươn dung để mã hóa mỗi mẫu PAM hoặc lớn hơn hoặc nhỏ hơn mẫu trước đó. Vì không hạn chế bởi 8 bit, mã hóa có thể hoạt động ở tốc độ khác nhau vào khoảng 20kbps.
• ADPCM (Adaptive differential PCM) – Kỹ thuật điều chế PCM khác biệt thích ứng: kỹ thuật này là một dẫn xuất của PCM chuẩn, ở đó sự khác biệt giữa các mẫu liên tiếp nhau được mã hóa, thay vì tất cả các mẫu được mã hóa, được truyền trên đường dây. CCITT có đề nghị các chuẩn ADPCM 32 Kbps, 24 Kbps, 16 Kbps cho mã hóa tiếng nói.
- Các phương pháp nén theo chuẩn của ITU G.711:
• Tốc độ G.711: 64 Kps=(2*4 kHz)*8 bit/mẫu.
• Tốc độ G.726: 32 Kps=(2*4 kHz)*4 bit/mẫu.
• Tốc độ G.726: 24 Kps=(2*4 kHz)*3 bit/mẫu.
• Tốc độ G.726: 16 Kps=(2*4 kHz)*2 bit/mẫu.
1. Quá trình lấy mẫu (Sampling)
Quá trình lấy mẫu âm thanh để chuyển từ Analog sang Digital
Tín hiệu Analog có dạng hình Sin. Và tần số âm thanh cho phép trên đường truyền trong khoảng từ 300 đến 3400 Hz. Tuy nhiên trong thực tế sẽ có một ít năng lượng nhiễu được chuyển qua dưới dạng các tần số cao hơn tần số 3400Hz. Theo lý thuyết Nyquist: tần số sẽ được lấy mẫu khoãng 8000 lần trên 1 giây.
2. Quá trình lượng tử hóa (Quantization)
Lượng tử hóa mẫu
Tiến trình kế tiếp của số hóa tín hiệu là biểu diễn giá trị chính xác cho mỗi mẫu được lấy. Mỗi mẫu có thể được gán cho một giá trị số, tương ứng với biên độ (theo chiều cao) của mẫu.
Biên độ chiều cao tối đa của mẫu trong khoãng 0 -> 127 (gọi là Positive) và 0 -> -127 (gọi là Negative). Mẫu sau khi lấy được chia thành 8 bits. Trong đó, bit đầu tiên sẽ được biểu diễn là 0 hoặc 1 dựa vào biên độ “Dương (+) sẽ là 1 ;Âm (-) sẽ là 0” và 7 bits còn lại biểu diễn cho độ lớn.
Sau khi thực hiện giới hạn đầu tiên đối với biên độ tương ứng với dải mẫu, đến lượt mỗi mẫu sẽ được so sánh với một tập hợp các mức lượng tử và gán vào một mức xấp xỉ với nó. Qui định rằng tất cả các mẫu trong cùng khoảng giữa hai mức lượng tử được xem có cùng giá trị. Sau đó giá trị gán được dùng trong hệ thống truyền. Sự phục hồi hình dạng tín hiệu ban đầu đòi hỏi thực hiện theo hướng ngược lại.
Lượng tử hóa tín hiệu âm thanh
Qui định rằng tất cả các mẫu trong cùng khoảng giữa hai mức lượng tử được xem có cùng giá trị. Sau đó giá trị gán được dùng trong hệ thống truyền. Quá trình lấy mẫu được thực hiện sau mỗi 8000 lần/giây. Mỗi lượng tử có giá trị là 8 bits. 8000 x 8 = 64000 bits. Tương đương 64 kb/s được cho phép trên đường truyền.Sự phục hồi hình dạng tín hiệu ban đầu đòi hỏi thực hiện theo hướng ngược lại.
3. Quá trình mã hóa (Encoding)
Mỗi mức lượng tử được chi định một giá trị số 8 bit, kết hợp 8 bit lại có 256 mức hay giá trị. Bit đầu tiên được quy ước cho việc đánh dấu giá trị âm hoặc dương cho mẫu. Bảy bit còn lại được biểu diễn cho độ lớn, bit đầu tiên chỉ nửa trên hay nửa dưới của dãy, bit thứ hai chỉ phần tư trên hay dưới, bit thứ 3 chỉ phần tàm trên hay dưới và cứ thế tiếp tục.
Nhiễu lượng tử
Ba bước tiến trình này sẽ lặp lại 8.000 lần mỗi giây cho dịch vụ kênh thoại, Dùng bước thứ tư là tùy chọn để nén hay tiêt kiệm băng thông. Với tùy chọn này thì một kênh có thể mang nhiều cuộc gọi đồng thời.
4. Quá trình nén giọng nói (Voice Compression)
Để có thể truyền các gói tin âm thanh một cách hiệu quả, tiết kiệm băng thông và đảm bảo cân bằng tải cho các dịch vụ khác trong mạng LAN/WAN, Người xây đựng mô hình mạng phải cân nhắc kĩ đến vấn đề lựa chọn giao thức đóng gói. Mặc dù kỹ thuật mã hóa PCM 64 Kbps hiện hành là phương pháp được chuẩn hóa, nhưng có vài phương pháp mã hóa khác được sử dụng trong những ứng dụng đặc biệt.
Các phương pháp này thực hiện mã hóa tiếng nói với tốc độ nhỏ hơn tốc độ của PCM, nhờ đó mà tận dụng được khả năng của hệ thống truyền dẫn số. Vì vậy, các mã hóa tốc độ thấp này sẽ bị hạn chế về chất lượng, đặc biệt là nhiễu méo tần số.
- Một số ví dụ hệ thống mã hóa tiếng nói tốc độ thấp:
• CVSD (Continously variable slope delta modulaton) – Kỹ thuật điều chế dựa trên sự chênh lệch trong biến đổi của tín hiệu liên tục: kỹ thuật này là một dẫn xuất của điều chế dựa trên sự chênh lệch (delta), trong đó một bit đươn dung để mã hóa mỗi mẫu PAM hoặc lớn hơn hoặc nhỏ hơn mẫu trước đó. Vì không hạn chế bởi 8 bit, mã hóa có thể hoạt động ở tốc độ khác nhau vào khoảng 20kbps.
• ADPCM (Adaptive differential PCM) – Kỹ thuật điều chế PCM khác biệt thích ứng: kỹ thuật này là một dẫn xuất của PCM chuẩn, ở đó sự khác biệt giữa các mẫu liên tiếp nhau được mã hóa, thay vì tất cả các mẫu được mã hóa, được truyền trên đường dây. CCITT có đề nghị các chuẩn ADPCM 32 Kbps, 24 Kbps, 16 Kbps cho mã hóa tiếng nói.
- Các phương pháp nén theo chuẩn của ITU G.711:
• Tốc độ G.711: 64 Kps=(2*4 kHz)*8 bit/mẫu.
• Tốc độ G.726: 32 Kps=(2*4 kHz)*4 bit/mẫu.
• Tốc độ G.726: 24 Kps=(2*4 kHz)*3 bit/mẫu.
• Tốc độ G.726: 16 Kps=(2*4 kHz)*2 bit/mẫu.