Trong suốt một năm qua, tôi đã hoàn toàn đắm chìm vào hệ sinh thái Home Assistant để xây dựng ngôi nhà thông minh của riêng mình, và kết quả là chất lượng cuộc sống đã được nâng cấp đáng kể. Từ việc liên kết giao diện âm thanh của máy tính với đèn thông minh cho đến các thông báo tùy chỉnh, mọi thứ đều thật tuyệt vời. Hơn nữa, tôi có thể thay thế vô số thiết bị dựa trên đám mây bằng các tùy chọn kiểm soát cục bộ, mạnh mẽ không kém, thậm chí còn vượt trội hơn. Trước đây, tôi đã sử dụng Google Home Hub và Google Nest Mini cho các lệnh điều khiển nhà thông minh bằng giọng nói. Tuy nhiên, kể từ khi sở hữu Home Assistant Voice Preview Edition vào đầu năm nay, tôi đã hoàn toàn từ bỏ trợ lý giọng nói của Google.
Home Assistant Voice Preview Edition (HAVPE) giống như một chiếc Google Nest Mini ở chỗ bạn có thể sử dụng từ khóa đánh thức (“Okay Nabu,” trong trường hợp này) để ra lệnh, thiết bị sẽ phản hồi và có thể điều khiển các thiết bị, phát nhạc hay đặt hẹn giờ. Điểm khác biệt lớn nhất là bạn kiểm soát dữ liệu của mình, và điều đó cũng có nghĩa là bạn kiểm soát các phản hồi của thiết bị. Như tên gọi, đây là một phiên bản “xem trước,” tức là chưa dành cho tất cả mọi người. Nhưng đối với những ai có kiến thức kỹ thuật và thời gian để đầu tư, HAVPE là một sự thay thế cực kỳ đáng giá.
Home Assistant Voice Preview Edition là gì?
Đây chưa phải là sản phẩm “hoàn thiện”
Home Assistant và Open Home Foundation đã và đang tập trung vào việc xây dựng một môi trường “ngôi nhà mở” (open home) cho phép bất kỳ ai cũng có thể tích hợp các thiết bị nhà thông minh từ nhiều hệ sinh thái khác nhau vào một nền tảng duy nhất. Đối với một số người, điều này vẫn có thể cần đến kết nối đám mây, trong khi những giải pháp khác cho phép kiểm soát hoàn toàn cục bộ và cắt đứt khỏi đám mây. Tuy nhiên, mặc dù có tích hợp Google Assistant để điều khiển các thiết bị hiện có trong Home Assistant, một trong những mục tiêu chính của dự án đang phát triển này là kết nối đám mây sẽ không cần thiết nếu người dùng không muốn.
Home Assistant Voice Preview là một thiết bị về cơ bản mang đến cái nhìn thoáng qua về tương lai đó, đó là lý do tại sao nó được gọi là “preview” (xem trước). Nó chưa được thiết kế để thay thế hoàn chỉnh Google Assistant hoặc Amazon Alexa ngay lúc này, mà tồn tại như một phần cứng hướng tới những người dùng đam mê nhất, những người muốn thử nghiệm một cái nhìn sớm về tương lai của các trợ lý giọng nói mã nguồn mở, được kiểm soát cục bộ. Hiện tại, dù có nhiều chức năng cơ bản ngay khi xuất xưởng, bạn không thể chỉ nói “Okay Nabu, thời tiết ngày mai thế nào?” và mong đợi một câu trả lời tương tự như Google cung cấp. Trên thực tế, ngay khi xuất xưởng, bạn không thể mong đợi một câu trả lời nào cả.
Nabu Casa, công ty sản xuất Home Assistant Voice Preview và được thành lập bởi nhiều người sáng lập Home Assistant, đã giải thích trong phần FAQ dưới tiêu đề “Tại sao đây lại được gọi là Phiên bản Xem trước?”:
Tầm nhìn của chúng tôi là biến trợ lý giọng nói mở, cục bộ và riêng tư thành hiện thực với mọi ngôn ngữ. Mặc dù chúng tôi đã đạt được những bước tiến lớn trong việc hiện thực hóa điều này, nhưng đây là một công việc lớn đến mức chúng tôi cần cộng đồng toàn cầu tham gia vào quá trình phát triển. Một yếu tố thiết yếu để cộng đồng thúc đẩy dự án tiến lên là một nền tảng phần cứng tiêu chuẩn cho giọng nói, được xây dựng cho Home Assistant từ đầu: Home Assistant Voice Preview Edition.
Mặc dù đối với một số người, trạng thái hiện tại của trợ lý giọng nói của chúng tôi có thể là tất cả những gì họ cần, chúng tôi nghĩ rằng vẫn còn nhiều việc phải làm trước khi nó sẵn sàng cho mọi nhà ở mọi quốc gia, và cho đến lúc đó, chúng tôi sẽ bán phiên bản Xem trước này của tương lai trợ lý giọng nói. Lấy lại quyền riêng tư của chúng ta không phải dành cho tất cả mọi người – đó là một hành trình – và chúng tôi muốn càng nhiều người càng tốt tham gia cùng chúng tôi và làm cho nó tốt hơn.
Vì vậy, với những điều này, đừng mua thiết bị này với kỳ vọng nó sẽ đánh bại mọi trợ lý điều khiển bằng giọng nói mà bạn có thể mua ngày nay. Tuy nhiên, nếu bạn muốn đóng góp vào quá trình phát triển và thử nghiệm, đồng thời trải nghiệm một thiết bị chuyên biệt đại diện cho tương lai đó, thì nó hoàn toàn xứng đáng để sở hữu. Trên thực tế, vì đây là một thiết bị mã nguồn hoàn toàn mở, bạn thậm chí có thể tự xây dựng một thiết bị của riêng mình tương tác với Home Assistant theo cách tương tự, và mức độ mở này đã được kích hoạt nhờ công sức và tài liệu được tạo ra bởi cả Nabu Casa và cộng đồng.
Thay thế chức năng của Google Assistant
Vai trò của cộng đồng trong việc nâng cấp tính năng
Thiết bị Home Assistant Voice Preview Edition đang hoạt động, hiển thị trạng thái sẵn sàng nhận lệnh
Như đã đề cập, cộng đồng đóng một vai trò lớn trong thiết bị đặc biệt này, và có những công cụ dễ triển khai trong Home Assistant không chỉ đạt được những gì Google đã có, mà còn vượt trội hơn. Ngay khi xuất xưởng, bạn có thể gọi các lệnh sau sau khi kích hoạt từ khóa đánh thức của mình:
- Bật và tắt các thực thể (entities)
- Bật và tắt đèn, thay đổi độ sáng và màu sắc, trong các khu vực cụ thể
- Điều khiển cửa sổ, rèm cửa và màn che
- Chạy các script tự động hóa
- Điều khiển các thiết bị phát đa phương tiện
- Điều khiển robot hút bụi
- Thêm vào danh sách (ví dụ: danh sách mua sắm)
- Hỏi ngày và giờ hiện tại
- Bắt đầu, hủy, chỉnh sửa và truy xuất hẹn giờ
- Kết hợp hẹn giờ với các lệnh điều khiển khác
Đọc qua danh sách này, có một số thiếu sót đáng chú ý. Bạn không thể nói “Phát bài hát X trên Spotify” hoặc hỏi về thời tiết, và đối với một sản phẩm thay thế Google Assistant, những thiếu sót này khá quan trọng. May mắn thay, đây là lúc cộng đồng phát huy vai trò của mình. Sử dụng tiện ích bổ sung Home Assistant Whisper để chuyển giọng nói của tôi thành văn bản để nó có thể được hiểu, chúng ta có thể sử dụng một cặp blueprint do cộng đồng tạo ra để thêm các chức năng đó trở lại chỉ trong vài phút. Nếu bạn không có phần cứng có thể sử dụng Whisper (mặc dù tôi chạy nó trên CPU 5700U, nên thành thật mà nói, nó không tốn quá nhiều sức mạnh tính toán), bạn thậm chí có thể sử dụng “speech to phrase,” ít linh hoạt hơn nhưng vẫn hoạt động.
Giao diện cấu hình blueprint thời tiết trong Home Assistant, giúp trợ lý giọng nói cung cấp thông tin khí hậu
Blueprint đầu tiên đáng để thiết lập là blueprint thời tiết, và nó thực hiện chính xác những gì tên gọi của nó. Về cơ bản, nó tạo ra một số lệnh thoại có thể được sử dụng để truy xuất thời tiết, và nó có hai biến thể: hoàn toàn cục bộ hoặc được hỗ trợ bởi LLM (Mô hình ngôn ngữ lớn). Tôi sử dụng phiên bản được hỗ trợ bởi LLM vì tôi tự host LLM của riêng mình, và nó ngay lập tức cung cấp nhiều hơn đáng kể so với những gì tôi nhận được với các thiết bị Google Nest. Thay vì khá cứng nhắc trong các câu hỏi của mình, tôi có thể hỏi mơ hồ hơn nhiều và yêu cầu thông tin ngữ cảnh đi kèm. Với blueprint này, tôi có thể hỏi những câu như “Hôm nay tôi có cần kem chống nắng không?” hoặc “Tối nay trời có mưa không?”.
Phiên bản chỉ cục bộ, không có LLM, vẫn khá mạnh mẽ và bổ sung chức năng thời tiết mà bạn mong đợi từ Google hoặc Amazon, nhưng điều tuyệt vời nhất là khả năng kiểm soát mà bạn có được khi có thể chỉ đạo cách trợ lý giọng nói của bạn phản hồi. Với LLM tự host của riêng tôi, tôi có thể nhận được các phản hồi độc đáo, dựa trên ngữ cảnh, mang lại cho tôi nhiều hơn là chỉ khả năng hỏi tổng quan về thời tiết trong một khoảng thời gian hoặc ngày nhất định.
Cài đặt blueprint Music Assistant trong Home Assistant Voice Preview, cho phép điều khiển nhạc bằng giọng nói
Tiếp theo là Music Assistant, và một lần nữa, nó có phiên bản chỉ cục bộ hoặc phiên bản nâng cao với LLM. Tôi sử dụng phiên bản nâng cao với LLM, nhưng tôi đã hiển thị phiên bản cục bộ ở trên để bạn có thể hình dung nó có thể làm gì mà không cần LLM. Kết hợp với tiện ích bổ sung Music Assistant, bạn có thể thực hiện tất cả các điều khiển nhạc thông thường mà bạn mong đợi, và với plugin Spotify Connect của Music Assistant, nó hoạt động giống hệt như bạn mong đợi trên thiết bị Google để truyền nhạc của bạn đến loa.
Với một LLM, mọi thứ có thể trở nên rất thú vị. Bạn không cần phải cứng nhắc trong các yêu cầu của mình, nhưng bạn có thể mô tả chi tiết hơn các yêu cầu của mình. Ví dụ: “Phát album mới nhất của Taylor Swift” thay vì phải nói tên album. Không phải là bạn cần chức năng này, nhưng việc có thể nói chuyện mơ hồ hơn nhiều và tổng thể là trò chuyện hơn với trợ lý giọng nói thật sự rất thú vị. Nó mang lại cảm giác tự nhiên hơn và phản hồi cũng nhanh nhạy.
Tất nhiên, bạn cũng có thể tự tạo các lệnh của riêng mình. Thay vì sử dụng blueprint hoặc script của cộng đồng, một lệnh thoại được định nghĩa trước đơn giản cực kỳ dễ tạo trong các tự động hóa của Home Assistant. Chỉ với một trigger “conversation” và văn bản tương ứng với lệnh của bạn, bạn có thể xác định các điều khiển đơn giản sẽ làm bất cứ điều gì bạn muốn. Bạn có thể tạo một trigger cuộc trò chuyện như “Tắt tiếng điện thoại của tôi,” sau đó bật chế độ không làm phiền trên điện thoại của bạn, như sau (mặc dù với thụt lề thích hợp):
trigger:
- platform: conversation
command:
- Mute my phone
action:
- service: notify.mobile_app_<your_device_id_here>
data:
message: "command_dnd"
data:
command: "priority_only"
Thật đơn giản đáng ngạc nhiên, và bạn có thể xây dựng các lệnh của riêng mình chỉ trong vòng chưa đầy một phút sau khi mọi thứ đã được thiết lập và chạy.
Đòi hỏi nhiều công sức hơn, không dành cho tất cả mọi người
Xây dựng phần mềm riêng đòi hỏi thời gian và sự kiên trì
Màn hình cài đặt ban đầu của ứng dụng Home Assistant Voice Preview Edition, cho thấy quá trình thiết lập
Mặc dù tôi hoàn toàn yêu thích Home Assistant Voice Preview Edition, tôi nhận ra rằng nó đòi hỏi rất nhiều công sức so với một thiết bị Google Nest hoặc Amazon Echo. Nó chưa dành cho tất cả mọi người vào thời điểm hiện tại, và đó chính là điểm mấu chốt. Phiên bản Xem trước về cơ bản là một cách để thu hút cộng đồng tham gia và thử nghiệm, đưa ra các ý tưởng và cách thức để làm cho trợ lý giọng nói của họ hoạt động hiệu quả cho chính họ. Mọi người chia sẻ những gì họ phát triển, những người khác tiếp nhận và cải thiện nó, và đội ngũ tại Nabu Casa có thể học hỏi những gì mọi người thích và không thích để họ có thể mang đến các tính năng phần mềm và cải tiến mới phù hợp với những người đó. Ngay cả các từ khóa đánh thức (wake word) cũng liên tục được cải thiện bằng cách thu thập dữ liệu giọng nói từ cộng đồng, và bạn cũng có thể tự huấn luyện từ khóa đánh thức của riêng mình.
Hiện tại, với tư cách là một người đam mê công nghệ và nhà phát triển, tôi rất yêu thích thiết bị nhỏ bé này. Việc chuyển từ “Hey Google” sang “Okay Nabu” đã diễn ra dễ dàng, nhưng điều đó không có nghĩa là nó sẽ phù hợp với tất cả mọi người. Điều đó hoàn toàn bình thường, và có một lý do tại sao nó là phiên bản xem trước chứ không phải một thiết bị hoàn chỉnh. Tuy nhiên, tôi hoàn toàn yêu thích nó, và nếu bạn giống tôi, có lẽ bạn cũng sẽ yêu thích nó.
Kết luận
Home Assistant Voice Preview Edition đại diện cho một bước tiến quan trọng hướng tới một tương lai nhà thông minh nơi quyền riêng tư và khả năng kiểm soát cục bộ được đặt lên hàng đầu. Mặc dù vẫn đang ở giai đoạn “xem trước” và đòi hỏi sự đầu tư về thời gian, kiến thức kỹ thuật từ người dùng, tiềm năng tùy biến vô hạn và khả năng hoạt động độc lập với đám mây là những lợi thế không thể phủ nhận. Với sự đóng góp không ngừng của cộng đồng, HAVPE không chỉ thay thế các chức năng cơ bản của trợ lý giọng nói truyền thống mà còn mở ra cánh cửa cho những trải nghiệm tương tác thông minh, cá nhân hóa đến không ngờ. Nếu bạn là một người yêu công nghệ, đam mê tùy biến và muốn nắm quyền kiểm soát hoàn toàn ngôi nhà của mình, Home Assistant Voice Preview Edition chính là hành trình thú vị dành cho bạn.
Hãy chia sẻ suy nghĩ của bạn về tương lai của trợ lý giọng nói mã nguồn mở và Home Assistant Voice Preview Edition trong phần bình luận bên dưới!