Chủ nhật 29/03/2026 10:29
Hotline: 024.355.63.010
Kinh tế số

Cùng tìm hiểu cách hệ thống SYNC có thể hiểu được các khẩu lệnh từ tài xế

12/10/2020 00:00
Sau nhiều lần chứng kiến những hậu quả đến từ việc lái xe mất tập trung, ông Cooper nhận ra sự cấp thiết trong việc tối ưu hóa công nghệ kích hoạt bằng giọng nói của SYNC®, bằng cách giản lược thông tin đầu vào xuống chỉ còn một câu lệnh.

Sau nhiều lần chứng kiến những hậu quả đến từ việc lái xe mất tập trung, ông Cooper nhận ra sự cấp thiết trong việc tối ưu hóa công nghệ kích hoạt bằng giọng nói của SYNC®, bằng cách giản lược thông tin đầu vào xuống chỉ còn một câu lệnh.

“Tôi đã gặp nhiều vụ tai nạn xảy ra do tài xế mất tập trung khi lái xe, và điều đó đã thôi thúc tôi nghiên cứu và phát triển công nghệ này”, ông Cooper chia sẻ. “Nhờ giảm thiểu tối đa sự phân tâm cũng như dễ dàng vận hành, hệ thống kích hoạt bằng giọng nói sẽ đảm bảo tài xế tập trung điều khiển xe một cách an toàn.”

Ông Cooper là nhân sự thuộc nhóm Phát triển Công nghệ Nhận diện Giọng nói của Ford tại trụ sở Dearborn, Michigan - đơn vị chịu trách nhiệm phát triển các tính năng cho hệ thống SYNC® 3. Việc xây dựng một hệ thống kích hoạt bằng giọng nói đơn giản và phù hợp cho khách hàng là một trong những mục tiêu chính của nhóm.

Công nghệ kích hoạt bằng giọng nói đã trở thành một phần của hệ thống SYNC® ngay từ những phiên bản đầu tiên cách đây 13 năm. Chính thức ra mắt vào năm 2014, SYNC® 3 đã và đang được cải tiến không ngừng. Hiện nay, với khả năng hỗ trợ lên tới 25 ngôn ngữ, hệ thống này đã đem đến cơ hội trải nghiệm cho nhiều người dùng trên toàn thế giới hơn.

SYNC® đã hiểu lời nói của chúng ta như thế nào?

Là trang bị tiêu chuẩn trên nhiều dòng xe khác nhau của Ford, SYNC® đã có bước phát triển vượt bậc - trở thành một trong những hệ thống kích hoạt bằng giọng nói trực quan và tiên tiến nhất hiện nay.

Thiết kế cốt lõi SYNC® là hệ thống nhận diện và ra lệnh bằng giọng nói - hoạt động giống như một bộ não nhận diện giọng nói. Cụm dữ liệu ngôn ngữ tích hợp với phần mềm giải mã sẽ chia nhỏ âm thanh để phân tích và hiểu từng câu mệnh lệnh của người dùng.

Cụm dữ liệu ngôn ngữ là một danh sách lớn các từ ngữ hoặc câu lệnh được lập trình để thực hiện một nhiệm vụ cụ thể. Ví dụ như câu lệnh “Gọi John Doe”, sẽ được ghi nhận bằng hơn 25 ngôn ngữ trên hệ thống SYNC®. Ngoài ra, một lượng lớn câu lệnh tương ứng với các tính năng (có thể kích hoạt bằng giọng nói trong) trên xe cũng được lưu trữ trong cụm dữ liệu ngôn ngữ của SYNC®.

Bên cạnh đó phần mềm giải mã giọng nói sẽ lọc ra đặc tính âm thanh của từng câu lệnh để khớp với danh sách các từ trong cụm dữ liệu ngôn ngữ. Như ví dụ trên, khi người dùng nói “Gọi John Doe”, phần mềm giải mã sẽ phân tích đặc tính của đoạn âm thanh thu được, sau đó tìm kiếm trong cụm dữ liệu ngôn ngữ để tìm ra mệnh lệnh (được lưu sẵn) có đặc tính âm thanh tương tự, qua đó giúp hệ thống SYNC® hiểu được yêu cầu từ người sử dụng.

Giọng nói thuộc các vùng miền khác nhau trên cùng một quốc gia cũng được lưu ý. Ở những ngôn ngữ được hỗ trợ như tiếng Anh, tiếng Trung, tiếng Thái… có rất nhiều phương ngữ và giọng nói khác nhau giữa các vùng miền vì vậy dữ liệu ngôn ngữ cũng được cập nhật đa dạng để nâng cao khả năng nhận diện một câu lệnh của hệ thống.

Đặt con người vào vị trí trung tâm của sự phát triển

Nhóm Phát triển Công nghệ Nhận diện Giọng nói của Ford được lãnh đạo bởi bà Yvonne Gloria, người đã có những đóng góp đáng kể trong quá trình cải tiến công nghệ này, kể từ khi SYNC® 3 ra mắt công chúng vào năm 2014.

Là một chuyên gia kỹ sư phần mềm, bà Gloria chia sẻ rằng sự đơn giản chính là chìa khóa dẫn đến thành công của hệ thống SYNC®. “Đa số người sử dụng phần mềm của chúng tôi đều không phải là kỹ sư. Chính vì vậy, chúng tôi đã phát triển phần mềm này để phục vụ những mục đích cụ thể và thực tế, nhưng không thể ép buộc khách hàng phải có một cái nhìn tương tự về sản phẩm. Điều này đã thúc đẩy tôi đặt mình vào suy nghĩ của một khách hàng, chứ không phải của một kỹ sư, từ đó, nghiên cứu cách những người dùng phổ thông tìm hiểu và ứng dụng công nghệ.” - Bà Gloria cho biết.

Sự tiến hoá không ngừng trên thế giới đã giúp các kỹ sư trong nhóm nỗ lực từng ngày để tinh chỉnh và mở rộng các tính năng của SYNC®. Bằng cách phân tích hành vi sử dụng SYNC® của khách hàng, các kỹ sư tiếp tục phát triển hệ thống trở nên trực quan và thân thiện hơn như tinh giản các tác vụ, hoặc đơn giản hóa việc truy cập. Qua quá trình đó, hơn 80% các câu lệnh của SYNC® đã có thể thực hiện chỉ với một bước.

Thông qua các nghiên cứu và phân tích chuyên sâu qua mạng không dây của SYNC® 3, các kỹ sư có thể ghi nhận một nguồn dữ liệu âm thanh đều đặn về cách khách hàng sử dụng SYNC® 3 cho các mục đích khác nhau. Từ đó, họ có thể phát hiện các lỗi phổ biến mà người dùng hay gặp phải, từ đó, sắp xếp và cải tiến các tác vụ phù hợp hơn, thay vì bỏ mặc người dùng tự xoay sở. Tất cả dữ liệu được thu thập đều phải có sự chấp thuận của người dùng.

“Chúng tôi liên tục theo dõi các phản hồi từ thị trường mục tiêu để nâng cấp tính năng và tạo ra các phiên bản cập nhật mới nhất. Công việc này sẽ liên tục được duy trì cho đến khi vòng đời sử dụng của sản phẩm kết thúc.” - Ông Cooper chia sẻ thêm.

Tương lai của công nghệ kích hoạt bằng giọng nói

“Rất nhiều cơ hội được mở ra cho các phương tiện được trang bị SYNC®, nhằm nâng tầm trải nghiệm của tài xế.” - Bà Gloria giải thích. “Đặc biệt, công nghệ hiện nay đang phát triển nhanh chóng và các màn hình giải trí cỡ lớn trên xe sẽ dần thay thế những nút bấm truyền thống, tạo nên một sân chơi đầy tiềm năng cho công nghệ kích hoạt bằng giọng nói trong tương lai.”

PV

Tin bài khác
Gemini mở tính năng nhập bộ nhớ, tạo sức ép mới trong cuộc đua AI

Gemini mở tính năng nhập bộ nhớ, tạo sức ép mới trong cuộc đua AI

Google vừa đưa vào Gemini tính năng “nhập bộ nhớ”, cho phép người dùng chuyển dữ liệu cá nhân, thói quen sử dụng và ngữ cảnh đã hình thành trên các chatbot như ChatGPT hay Claude. Bước đi này được xem là nỗ lực đáng chú ý nhằm giảm bớt trở ngại khi người dùng muốn dịch chuyển giữa các nền tảng AI.
Không còn đầu tư dàn trải: Đâu là những ngành công nghệ chiến lược tạo động lực tăng trưởng mới cho Việt Nam?

Không còn đầu tư dàn trải: Đâu là những ngành công nghệ chiến lược tạo động lực tăng trưởng mới cho Việt Nam?

Bộ KH&CN yêu cầu rà soát, cập nhật danh mục công nghệ chiến lược nhằm nâng cao năng lực cạnh tranh, phát triển ngành công nghiệp mới và đảm bảo tự chủ.
Melania Trump chọn robot Figure 03 để truyền thông điệp mới về AI và tương lai trẻ em

Melania Trump chọn robot Figure 03 để truyền thông điệp mới về AI và tương lai trẻ em

Đệ nhất phu nhân Mỹ Melania Trump đã xuất hiện cùng robot hình người Figure 03 tại Nhà Trắng trong khuôn khổ hội nghị thượng đỉnh toàn cầu về giáo dục và công nghệ cho trẻ em. Sự kiện quy tụ đại diện từ 45 quốc gia và 28 tổ chức công nghệ, cho thấy AI đang được đưa vào trung tâm các cuộc thảo luận về giáo dục tương lai.
Doanh nghiệp phải vượt “bài kiểm tra” vốn và công nghệ để vận hành sàn giao dịch tài sản mã hóa

Doanh nghiệp phải vượt “bài kiểm tra” vốn và công nghệ để vận hành sàn giao dịch tài sản mã hóa

Thị trường tài sản mã hóa tại Việt Nam đang bước vào giai đoạn chuẩn bị thực chất cho chương trình thí điểm, nhưng để vận hành một sàn giao dịch hợp pháp, doanh nghiệp không chỉ cần vốn lớn mà còn phải đáp ứng loạt tiêu chuẩn ngặt nghèo về công nghệ, an ninh hệ thống và bảo vệ nhà đầu tư.
ONUS tê liệt giao dịch, HVA nói bộ máy điều hành vẫn hoạt động bình thường

ONUS tê liệt giao dịch, HVA nói bộ máy điều hành vẫn hoạt động bình thường

Giữa lúc nhiều nhà đầu tư không thể đăng nhập, rút tiền trên app ONUS từ tối 20/3, HVA Group khẳng định doanh nghiệp vẫn hoạt động bình thường, đồng thời cảnh báo nguy cơ bùng phát các chiêu lừa “hỗ trợ lấy lại tiền”.
OpenAI thâu tóm Astral, tăng tốc Codex trong cuộc đua AI viết code

OpenAI thâu tóm Astral, tăng tốc Codex trong cuộc đua AI viết code

OpenAI vừa ký thỏa thuận mua lại Astral - startup đứng sau các công cụ Python mã nguồn mở phổ biến như uv, Ruff và ty - trong bước đi được đánh giá là mang tính chiến lược để tăng tốc Codex. Thương vụ cho thấy cuộc đua AI viết code đang chuyển từ mô hình “trợ lý sinh mã” sang giai đoạn mới, nơi các hãng công nghệ tìm cách kiểm soát sâu hơn các lớp công cụ cốt lõi trong hệ sinh thái phát triển phần mềm.
Bí mật phía sau đơn đến trong 1 giờ, thậm chí 30 phút của Amazon

Bí mật phía sau đơn đến trong 1 giờ, thậm chí 30 phút của Amazon

Amazon đang đẩy cuộc đua giao hàng siêu tốc lên một nấc mới khi triển khai dịch vụ nhận hàng trong 1 giờ tại hàng trăm khu vực ở Mỹ, đồng thời thử nghiệm mô hình giao trong 30 phút. Tốc độ kỷ lục này giúp hãng gia tăng sức ép lên Walmart và toàn ngành bán lẻ, nhưng cũng đặt ra câu hỏi lớn về chi phí vận hành và áp lực lao động trong chuỗi logistics.
Nvidia đặt cược vào “AI vận hành”, dự báo thị trường chip đạt 1.000 tỷ USD

Nvidia đặt cược vào “AI vận hành”, dự báo thị trường chip đạt 1.000 tỷ USD

Tại hội nghị công nghệ GTC 2026 diễn ra ở San Jose (Mỹ), CEO Jensen Huang công bố bước chuyển chiến lược quan trọng của Nvidia: tập trung vào giai đoạn vận hành AI (AI inference), nơi các mô hình trí tuệ nhân tạo được triển khai vào thực tế.
Samsung đối mặt nguy cơ thua lỗ lần đầu ở mảng di động dù Galaxy S26 bán chạy

Samsung đối mặt nguy cơ thua lỗ lần đầu ở mảng di động dù Galaxy S26 bán chạy

Dù Galaxy S26 đạt doanh số khả quan, Samsung vẫn phải đối mặt bài toán lớn hơn: làm sao duy trì lợi nhuận trong một thị trường smartphone ngày càng cạnh tranh và chi phí ngày càng cao.
Oppo Find X9 Ultra rò rỉ camera 10x: Khẩu độ lớn hơn, tham vọng dẫn đầu nhiếp ảnh di động

Oppo Find X9 Ultra rò rỉ camera 10x: Khẩu độ lớn hơn, tham vọng dẫn đầu nhiếp ảnh di động

Oppo Find X9 Ultra lộ thông tin camera 10x periscope khẩu độ f/3.5, cảm biến telephoto 200MP và hệ thống camera nâng cấp mạnh, hứa hẹn cạnh tranh trực tiếp trong phân khúc flagship cao cấp.
Công nghệ UAV bầy đàn hỗ trợ chữa cháy trong đô thị

Công nghệ UAV bầy đàn hỗ trợ chữa cháy trong đô thị

Công ty CT UAV, thành viên của CT Group, đang phát triển hệ thống UAV bầy đàn chữa cháy mang tên Fire Swarm, hướng đến giải quyết bài toán xử lý hỏa hoạn tại các khu vực ngõ nhỏ, hẻm sâu – nơi phương tiện cứu hỏa truyền thống khó tiếp cận.
Xuất hiện khái niệm “drone chúa” mang hàng nghìn UAV

Xuất hiện khái niệm “drone chúa” mang hàng nghìn UAV

Những nền tảng máy bay không người lái siêu tải trọng, có khả năng mang theo hàng trăm đến hàng nghìn UAV cỡ nhỏ, có thể sớm xuất hiện trong tương lai gần.
Xiaomi 17 Ultra có gì mới khi sở hữu camera 200MP và pin 6000mAh?

Xiaomi 17 Ultra có gì mới khi sở hữu camera 200MP và pin 6000mAh?

Xiaomi 17 Ultra là mẫu smartphone flagship mới được giới thiệu trong năm 2026, tiếp tục kế thừa định hướng công nghệ cao cấp của dòng Xiaomi Ultra.
Internet Việt Nam sẵn sàng cho “kinh tế tầm thấp”

Internet Việt Nam sẵn sàng cho “kinh tế tầm thấp”

Sự phát triển nhanh của hạ tầng viễn thông đang đưa Internet Việt Nam trở thành một trong những nền tảng quan trọng thúc đẩy kinh tế số, đặc biệt là các mô hình kinh tế mới như kinh tế tầm thấp (Low Altitude Economy – LAE).
Apple Music bắt đầu gắn nhãn nội dung AI trong âm nhạc

Apple Music bắt đầu gắn nhãn nội dung AI trong âm nhạc

Nền tảng nghe nhạc trực tuyến Apple Music vừa triển khai hệ thống “thẻ minh bạch” (transparency tags) nhằm giúp người dùng nhận biết liệu nội dung âm nhạc họ đang nghe có được tạo ra bằng trí tuệ nhân tạo (AI) hay không.