
Microsoft Edge może teraz tłumaczyć wideo — ale jest jeden duży haczyk

Naj nowsza wersja beta Microsoft Edge zawiera eksperymentalną funkcję tłumaczenia dźwięku wideo w czasie rzeczywistym. Ukryta w ustawieniach pod „Sugeruj tłumaczenie wideo na obsługiwanych stronach”, ta nowa opcja dodaje pływający pasek narzędzi podczas odtwarzania na niektórych platformach po jej włączeniu. Na razie funkcjonalność jest dość ograniczona. Obsługuje tylko tłumaczenie z i na trzy języki: angielski, hiszpański i koreański, a wsparcie dla stron internetowych jest minimalne — jak dotąd działa niezawodnie tylko na YouTube.
Największą wadą są wysokie wymagania sprzętowe. Ponieważ opiera się na tłumaczeniu neuronowym wspieranym przez AI, funkcja potrzebuje co najmniej 12 GB pamięci RAM, aby działać. Tego rodzaju zapotrzebowanie na zasoby stanowi problem nawet dla nowoczesnych systemów z 16 GB, zwłaszcza że sam Windows 11 używa około 4 GB pamięci RAM w tle. Kiedy odtwarzasz wideo z włączonym tłumaczeniem, przeglądarka może skutecznie zająć całą dostępną pamięć, co może powodować zacięcia w innych aplikacjach.
W testach tłumaczenie uruchamiało się z niemal zerowym opóźnieniem, ale zauważyliśmy pewne dziwactwa. W jednym hiszpańskim wideo z jednym mówcą, AI czasami generowało dwa oddzielne ścieżki dźwiękowe — jedną męską i jedną żeńską — prawdopodobnie dlatego, że zostało oszukane przez zmiany w tonie głosu mówcy. Ta funkcja podglądu jest stopniowo udostępniana użytkownikom w beta kanale Edge dla Windows 11. Nie ma jeszcze informacji, kiedy może trafić do stabilnej wersji przeglądarki.
W międzyczasie Microsoft kontynuuje modernizację innych części Edge. Firma niedawno ogłosiła, że całkowicie rezygnuje z własnego silnika PDF na rzecz silnika od Adobe, co powinno znacznie poprawić obsługę plików PDF.
To nowe narzędzie tłumaczeniowe jest ciekawą demonstracją potencjału AI w przeglądarkach, ale jego obecna implementacja jest naprawdę tylko dla systemów wysokiej klasy. Programiści będą musieli zoptymalizować jego zużycie zasobów i znacznie rozszerzyć listę obsługiwanych języków i platform, aby mogło stać się powszechne. Mówiąc to, biorąc pod uwagę, że funkcja jest głównie skierowana na oglądanie treści w obcych językach, i biorąc pod uwagę, że YouTube pracuje nad podobną funkcją w platformie, trzeba się zastanowić nad jej długoterminową koniecznością.
-
Microsoft testuje Copilot 3D: AI przekształca Twoje zdjęcia 2D w obiekty 3D
-
Excel Copilot firmy Microsoft wchodzi w fazę beta, pozwalając Ci zrezygnować z formuł na rzecz poleceń zasilanych sztuczną inteligencją
-
Microsoft ma na celu rozwiązanie największego problemu w grach na PC: zacięcia podczas kompilacji shaderów
-
Microsoft i Cloudflare celują w Google z nowym standardem wyszukiwania
-
Microsoft przypomina użytkownikom, że wsparcie dla Windows 10 kończy się za miesiąc