Thứ ba 30/06/2026 17:47
Hotline: 024.355.63.010
Kinh tế số

Cùng tìm hiểu cách hệ thống SYNC có thể hiểu được các khẩu lệnh từ tài xế

12/10/2020 00:00
Sau nhiều lần chứng kiến những hậu quả đến từ việc lái xe mất tập trung, ông Cooper nhận ra sự cấp thiết trong việc tối ưu hóa công nghệ kích hoạt bằng giọng nói của SYNC®, bằng cách giản lược thông tin đầu vào xuống chỉ còn một câu lệnh.

Sau nhiều lần chứng kiến những hậu quả đến từ việc lái xe mất tập trung, ông Cooper nhận ra sự cấp thiết trong việc tối ưu hóa công nghệ kích hoạt bằng giọng nói của SYNC®, bằng cách giản lược thông tin đầu vào xuống chỉ còn một câu lệnh.

“Tôi đã gặp nhiều vụ tai nạn xảy ra do tài xế mất tập trung khi lái xe, và điều đó đã thôi thúc tôi nghiên cứu và phát triển công nghệ này”, ông Cooper chia sẻ. “Nhờ giảm thiểu tối đa sự phân tâm cũng như dễ dàng vận hành, hệ thống kích hoạt bằng giọng nói sẽ đảm bảo tài xế tập trung điều khiển xe một cách an toàn.”

Ông Cooper là nhân sự thuộc nhóm Phát triển Công nghệ Nhận diện Giọng nói của Ford tại trụ sở Dearborn, Michigan - đơn vị chịu trách nhiệm phát triển các tính năng cho hệ thống SYNC® 3. Việc xây dựng một hệ thống kích hoạt bằng giọng nói đơn giản và phù hợp cho khách hàng là một trong những mục tiêu chính của nhóm.

Công nghệ kích hoạt bằng giọng nói đã trở thành một phần của hệ thống SYNC® ngay từ những phiên bản đầu tiên cách đây 13 năm. Chính thức ra mắt vào năm 2014, SYNC® 3 đã và đang được cải tiến không ngừng. Hiện nay, với khả năng hỗ trợ lên tới 25 ngôn ngữ, hệ thống này đã đem đến cơ hội trải nghiệm cho nhiều người dùng trên toàn thế giới hơn.

SYNC® đã hiểu lời nói của chúng ta như thế nào?

Là trang bị tiêu chuẩn trên nhiều dòng xe khác nhau của Ford, SYNC® đã có bước phát triển vượt bậc - trở thành một trong những hệ thống kích hoạt bằng giọng nói trực quan và tiên tiến nhất hiện nay.

Thiết kế cốt lõi SYNC® là hệ thống nhận diện và ra lệnh bằng giọng nói - hoạt động giống như một bộ não nhận diện giọng nói. Cụm dữ liệu ngôn ngữ tích hợp với phần mềm giải mã sẽ chia nhỏ âm thanh để phân tích và hiểu từng câu mệnh lệnh của người dùng.

Cụm dữ liệu ngôn ngữ là một danh sách lớn các từ ngữ hoặc câu lệnh được lập trình để thực hiện một nhiệm vụ cụ thể. Ví dụ như câu lệnh “Gọi John Doe”, sẽ được ghi nhận bằng hơn 25 ngôn ngữ trên hệ thống SYNC®. Ngoài ra, một lượng lớn câu lệnh tương ứng với các tính năng (có thể kích hoạt bằng giọng nói trong) trên xe cũng được lưu trữ trong cụm dữ liệu ngôn ngữ của SYNC®.

Bên cạnh đó phần mềm giải mã giọng nói sẽ lọc ra đặc tính âm thanh của từng câu lệnh để khớp với danh sách các từ trong cụm dữ liệu ngôn ngữ. Như ví dụ trên, khi người dùng nói “Gọi John Doe”, phần mềm giải mã sẽ phân tích đặc tính của đoạn âm thanh thu được, sau đó tìm kiếm trong cụm dữ liệu ngôn ngữ để tìm ra mệnh lệnh (được lưu sẵn) có đặc tính âm thanh tương tự, qua đó giúp hệ thống SYNC® hiểu được yêu cầu từ người sử dụng.

Giọng nói thuộc các vùng miền khác nhau trên cùng một quốc gia cũng được lưu ý. Ở những ngôn ngữ được hỗ trợ như tiếng Anh, tiếng Trung, tiếng Thái… có rất nhiều phương ngữ và giọng nói khác nhau giữa các vùng miền vì vậy dữ liệu ngôn ngữ cũng được cập nhật đa dạng để nâng cao khả năng nhận diện một câu lệnh của hệ thống.

Đặt con người vào vị trí trung tâm của sự phát triển

Nhóm Phát triển Công nghệ Nhận diện Giọng nói của Ford được lãnh đạo bởi bà Yvonne Gloria, người đã có những đóng góp đáng kể trong quá trình cải tiến công nghệ này, kể từ khi SYNC® 3 ra mắt công chúng vào năm 2014.

Là một chuyên gia kỹ sư phần mềm, bà Gloria chia sẻ rằng sự đơn giản chính là chìa khóa dẫn đến thành công của hệ thống SYNC®. “Đa số người sử dụng phần mềm của chúng tôi đều không phải là kỹ sư. Chính vì vậy, chúng tôi đã phát triển phần mềm này để phục vụ những mục đích cụ thể và thực tế, nhưng không thể ép buộc khách hàng phải có một cái nhìn tương tự về sản phẩm. Điều này đã thúc đẩy tôi đặt mình vào suy nghĩ của một khách hàng, chứ không phải của một kỹ sư, từ đó, nghiên cứu cách những người dùng phổ thông tìm hiểu và ứng dụng công nghệ.” - Bà Gloria cho biết.

Sự tiến hoá không ngừng trên thế giới đã giúp các kỹ sư trong nhóm nỗ lực từng ngày để tinh chỉnh và mở rộng các tính năng của SYNC®. Bằng cách phân tích hành vi sử dụng SYNC® của khách hàng, các kỹ sư tiếp tục phát triển hệ thống trở nên trực quan và thân thiện hơn như tinh giản các tác vụ, hoặc đơn giản hóa việc truy cập. Qua quá trình đó, hơn 80% các câu lệnh của SYNC® đã có thể thực hiện chỉ với một bước.

Thông qua các nghiên cứu và phân tích chuyên sâu qua mạng không dây của SYNC® 3, các kỹ sư có thể ghi nhận một nguồn dữ liệu âm thanh đều đặn về cách khách hàng sử dụng SYNC® 3 cho các mục đích khác nhau. Từ đó, họ có thể phát hiện các lỗi phổ biến mà người dùng hay gặp phải, từ đó, sắp xếp và cải tiến các tác vụ phù hợp hơn, thay vì bỏ mặc người dùng tự xoay sở. Tất cả dữ liệu được thu thập đều phải có sự chấp thuận của người dùng.

“Chúng tôi liên tục theo dõi các phản hồi từ thị trường mục tiêu để nâng cấp tính năng và tạo ra các phiên bản cập nhật mới nhất. Công việc này sẽ liên tục được duy trì cho đến khi vòng đời sử dụng của sản phẩm kết thúc.” - Ông Cooper chia sẻ thêm.

Tương lai của công nghệ kích hoạt bằng giọng nói

“Rất nhiều cơ hội được mở ra cho các phương tiện được trang bị SYNC®, nhằm nâng tầm trải nghiệm của tài xế.” - Bà Gloria giải thích. “Đặc biệt, công nghệ hiện nay đang phát triển nhanh chóng và các màn hình giải trí cỡ lớn trên xe sẽ dần thay thế những nút bấm truyền thống, tạo nên một sân chơi đầy tiềm năng cho công nghệ kích hoạt bằng giọng nói trong tương lai.”

PV

Tin bài khác
Softel Solutions nâng cao năng lực bảo mật đám mây cùng AWS và Noventiq

Softel Solutions nâng cao năng lực bảo mật đám mây cùng AWS và Noventiq

Trước áp lực tăng trưởng nhanh của nền kinh tế số, việc hợp tác với Noventiq và AWS giúp doanh nghiệp viễn thông Việt Nam khắc phục hoàn toàn các lỗ hổng hệ thống nghiêm trọng, thiết lập kiến trúc an ninh mạng đồng bộ đạt tiêu chuẩn quốc tế.
Farm-ng Amiga: Chiếc máy kéo điện thông minh giúp ngành nông nghiệp toàn cầu tìm ra lời giải trong suốt một thế kỷ

Farm-ng Amiga: Chiếc máy kéo điện thông minh giúp ngành nông nghiệp toàn cầu tìm ra lời giải trong suốt một thế kỷ

Có một cuộc khủng hoảng đang xảy ra âm thầm trên những cánh đồng khắp thế giới, và người tiêu dùng thường chỉ nhận ra khi giá thực phẩm trên kệ siêu thị bắt đầu tăng không rõ lý do. Nông nghiệp đang đối mặt với tình trạng thiếu lao động nghiêm trọng, khi số người sẵn sàng và có khả năng làm việc trong các trang trại đang giảm dần theo từng năm, trong khi nhu cầu thực phẩm toàn cầu tiếp tục tăng theo đà dân số.
Tây Ninh phát triển hệ sinh thái UAV, đón cơ hội tăng trưởng mới

Tây Ninh phát triển hệ sinh thái UAV, đón cơ hội tăng trưởng mới

Tây Ninh đang từng bước hiện thực hóa mục tiêu trở thành trung tâm phát triển hệ sinh thái thiết bị bay không người lái (UAV) khi thúc đẩy hợp tác với doanh nghiệp Hàn Quốc và đồng thời hoàn thiện cơ chế thử nghiệm có kiểm soát (sandbox). Đây được xem là bước đi quan trọng để địa phương mở ra không gian tăng trưởng mới dựa trên công nghệ chiến lược.
Google mở miễn phí tính năng tạo ảnh cá nhân hóa trên Gemini

Google mở miễn phí tính năng tạo ảnh cá nhân hóa trên Gemini

Google vừa mở miễn phí tính năng tạo ảnh cá nhân hóa trên Gemini cho người dùng đủ điều kiện tại Mỹ, cho phép AI khai thác dữ liệu từ Google Photos và các dịch vụ Google để tạo hình ảnh phù hợp với từng người dùng.
Mỹ siết quản lý mạng xã hội, bảo vệ trẻ em trên không gian mạng

Mỹ siết quản lý mạng xã hội, bảo vệ trẻ em trên không gian mạng

Hạ viện Mỹ thông qua dự luật tăng cường an toàn trực tuyến cho trẻ em, trong bối cảnh nhiều quốc gia đang đẩy mạnh các biện pháp hạn chế mạng xã hội đối với người dùng vị thành niên.
Mỹ cho phép hơn 100 tổ chức truy cập mô hình AI Mythos 5 của Anthropic

Mỹ cho phép hơn 100 tổ chức truy cập mô hình AI Mythos 5 của Anthropic

Chính phủ Mỹ đã cho phép Anthropic phát hành trở lại mô hình AI Mythos 5 tới một số doanh nghiệp và tổ chức trong nước sau thời gian tạm dừng vì các lo ngại liên quan đến an ninh quốc gia.
Tencent “gom” gần 3 tỷ USD chip nhớ: CXMT được tiếp sức trước IPO bom tấn

Tencent “gom” gần 3 tỷ USD chip nhớ: CXMT được tiếp sức trước IPO bom tấn

Tencent được cho là đã khóa nguồn cung DRAM dài hạn từ CXMT bằng một thỏa thuận trị giá gần 3 tỷ USD, trong lúc cơn sốt AI khiến chip nhớ trở thành “hàng nóng” trên toàn cầu.
Doanh nghiệp và người dân hưởng lợi gì khi vận hành sàn giao dịch carbon trong nước

Doanh nghiệp và người dân hưởng lợi gì khi vận hành sàn giao dịch carbon trong nước

Không chỉ dừng lại ở một công cụ quản lý môi trường, thị trường carbon đóng vai trò như một đòn bẩy kinh tế mang lại nguồn thu trực tiếp cho doanh nghiệp và nâng cao chất lượng sống cho người dân.
GLM-5.2 của Zhipu AI gây chú ý với hiệu năng tiệm cận OpenAI và Anthropic

GLM-5.2 của Zhipu AI gây chú ý với hiệu năng tiệm cận OpenAI và Anthropic

Mô hình AI GLM-5.2 do Zhipu AI phát triển đang thu hút sự quan tâm khi đạt hiệu năng lập trình tiệm cận các mô hình AI hàng đầu của Mỹ, trong khi chi phí sử dụng được đánh giá thấp hơn đáng kể.
Miko: Người bạn AI đầu tiên của trẻ em trong thế giới ngày càng cô đơn

Miko: Người bạn AI đầu tiên của trẻ em trong thế giới ngày càng cô đơn

Ít bậc phụ huynh nào dám thừa nhận thẳng thắn rằng con cái của họ đang lớn lên trong một thế giới kết nối hơn bao giờ hết nhưng cũng cô đơn hơn nhiều thế hệ trước. Cha mẹ đi làm từ sáng đến tối, ông bà sống xa, anh chị em mỗi người một màn hình điện thoại. Không có sự kết nối nào trong gia đình, thậm chí những giờ học trực tuyến khó có thể thay thế sự hiện diện của một người thực sự lắng nghe.
Google “không đủ bán” Gemini cho Meta

Google “không đủ bán” Gemini cho Meta

Cơn sốt AI đang nóng đến mức ngay cả các “ông lớn” công nghệ cũng không còn dư dả năng lực tính toán để phục vụ mọi nhu cầu.
Apple lao vào "canh bạc" chip Trung Quốc

Apple lao vào "canh bạc" chip Trung Quốc

Financial Times dẫn các nguồn tin thân cận cho biết Apple đang tìm kiếm sự chấp thuận từ Washington để mua chip nhớ từ CXMT, trong bối cảnh giá bộ nhớ leo thang mạnh vì làn sóng đầu tư vào trí tuệ nhân tạo.
Sau 2 tuần siết chặt, Mỹ bất ngờ “mở khóa” AI Anthropic

Sau 2 tuần siết chặt, Mỹ bất ngờ “mở khóa” AI Anthropic

Sau 2 tuần siết quyền truy cập, Chính phủ Mỹ đã cho phép Anthropic phát hành Claude Mythos 5 cho các nhóm đối tác được duyệt.
Mỹ tịch thu gần 400 tên miền phát lậu World Cup

Mỹ tịch thu gần 400 tên miền phát lậu World Cup

Trong bối cảnh FIFA World Cup thu hút sự quan tâm lớn của người hâm mộ toàn cầu, chính quyền Mỹ đã đồng loạt tịch thu gần 400 tên miền bị cáo buộc phát sóng trái phép các trận đấu, qua đó siết chặt cuộc chiến chống vi phạm bản quyền thể thao trên môi trường số.
Meta tăng tốc dùng AI thay người kiểm duyệt, tham vọng tiết kiệm hàng tỷ USD mỗi năm

Meta tăng tốc dùng AI thay người kiểm duyệt, tham vọng tiết kiệm hàng tỷ USD mỗi năm

Meta đang đặt cược lớn vào AI không chỉ để tạo ra sản phẩm mới, mà còn để tự động hóa chính bộ máy vận hành khổng lồ của mình — từ kiểm duyệt nội dung, quảng cáo cho tới hỗ trợ khách hàng.