Χρηματοδότηση
Η Mirelo Συγκεντρώνει 41 Εκατομμύρια Δολάρια για να Φέρει τον Ηχο που Γεννιέται από τον AI στα Βίντεο, τα Παιχνίδια και Πέρα

Η Berlin-based Mirelo έχει συγκεντρώσει 41 εκατομμύρια δολάρια σε μια στροφή σπόρων, καθώς επιδιώκει να λύσει ένα από τα πιο επίμονες τυφλά σημεία στα γεννητικά μέσα: τον ήχο. Η χρηματοδότηση ήταν συν-ηγεμονική από Index Ventures και Andreessen Horowitz, με συμμετοχή από Atlantic.vc και TriplePoint Capital, υπογραμμίζοντας την αυξανόμενη εμπιστοσύνη των επενδυτών ότι ο ήχος είναι η επόμενη μεγάλη μετωπική για την AI-ωδή творική.
Ενώ η τεχνητή νοημοσύνη έχει μεταμορφώσει γρήγορα τον τρόπο με τον οποίο παράγονται κείμενο, εικόνες και βίντεο, ο ήχος έχει μείνει πίσω. Η μουσική, οι ήχοι και οι περιβαλλοντικοί ήχοι παραμένουν εργατοαπαιτητικοί, συχνά προστίθενται αργά στη διαδικασία δημιουργίας, παρά την υπερμεγέθη επίδρασή τους στην αντίληψη του περιεχομένου. Η φιλοδοξία της Mirelo είναι να αλλάξει αυτό, κάνοντας τον υψηλής ποιότητας, συναισθηματικά ανταποκρινόμενο ήχο τόσο εύκολο να παραχθεί όσο και οι οπτικές.
Γιατί ο Ήχος Έχει Μείνει Πίσω
Ο ήχος έχει μια μοναδική ικανότητα να διαμορφώνει συναισθήματα, τάση και ατμόσφαιρα. Ένα βίντεο χωρίς ήχο, ανεξάρτητα από το πόσο οπτικά εντυπωσιακό είναι, σπάνια feels ολοκληρωμένο. Ωστόσο, για τους meisten δημιουργούς, η προσθήκη ήχου vẫn σημαίνει αναζήτηση σε βιβλιοθήκες stock, χειροκίνητη ευθυγράμμιση ήχων και επανάληψη σε χρονοδιαγράμματα μέχρι να feels σωστό.
Αυτή η ανισορροπία έχει γίνει πιο εμφανής καθώς η δημιουργία βίντεο επιταχύνεται. Τα AI-γεννημένα οπτικά, το περιεχόμενο των κοινωνικών μέσων, και τα προσαρμοζόμενα περιβάλλοντα παιχνιδιών κινηθούν γρηγορότερα από τις παραδοσιακές ροές εργασίας ήχου. Το αποτέλεσμα είναι μια αυξανόμενη διαφορά μεταξύ того που οι δημιουργοί μπορούν να φανταστούν οπτικά και τι μπορούν να εκτελέσουν πραγματικά ηχητικά.
Οι ιδρυτές της Mirelo είδαν αυτή τη διαφορά όχι ως μια περιορισμένη δημιουργικότητα, αλλά ως μια περιορισμένη εργαλειοθήκη.
Κατασκευή Θεμελιωδών Μοντέλων για Ήχο
Ιδρυθείσα το 2023, η Mirelo έχει αναπτύξει τα δικά της θεμελιώδη μοντέλα που σχεδιάστηκαν ειδικά για τον ήχο στα βίντεο. Αντί να επαναχρησιμοποιήσει μεγάλα μοντέλα γλωσσών ή συστήματα βασισμένα σε εικόνες, η εταιρεία επικεντρώθηκε στον ήχο από την αρχή. Ένας χρήστης μπορεί να ανεβάσει ένα βίντεο και, μέσα σε δευτερόλεπτα, να λάβει συγχρονισμένους ήχους που ανταποκρίνονται στην κίνηση, τον χρόνο και τα γεγονότα στην οθόνη.
Αυτή η προσέγγιση είναι ιδιαίτερα σχετική σε περιβάλλοντα όπου το περιεχόμενο είναι δυναμικό. Τα AI-γεννημένα βίντεο, τα προσωποποιημένα κοινωνικά feeds, και τα σύγχρονα βιντεοπαιχνίδια ωφελούνται 모두 από ήχο που μπορεί να προσαρμοστεί σε πραγματικό χρόνο. Το σύστημα της Mirelo γεννά ήχο γρηγορότερα από τον πραγματικό χρόνο, επιτρέποντάς του να跟λεί την εμπειρία που αλλάζει στην πτήση.
Η εταιρεία κυκλοφόρησε πρόσφατα το Mirelo SFX v1.5, ένα μοντέλο βίντεο-ήχου που είναι διαθέσιμο μέσω της αυτοεξυπηρετούμενης API και της web εφαρμογής, Mirelo Studio. Σύμφωνα με την εταιρεία, τα μοντέλα της είναι ελαφριά, απαιτώντας σημαντικά λιγότερο υπολογιστικό από τα τυπικά μεγάλα μοντέλα γλωσσών ενώ παράγουν ανταγωνιστική ή υπεροχή ποιότητα ήχου σε εξωτερικές αξιολογήσεις.
Μουσικοί στο Κέντρο της Τεχνολογίας
Ένα από τα χαρακτηριστικά της Mirelo είναι η ιδρυτική ομάδα. Ο CEO CJ Simon-Gabriel και ο CTO Florian Wenzel είναι και οι δύο καταξιωμένοι μουσικοί καθώς και έμπειροι ερευνητές AI. Ο Simon-Gabriel κατέχει διδακτορικό στη μηχανική μάθηση και αιτιώδη ερμηνεία από το Ινστιτούτο Max Planck και ολοκλήρωσε μια μεταδιδακτορική ερευνητική υποτροφία στο ETH Zurich. Ο Wenzel έλαβε το διδακτορικό του στη βαθιά μάθηση από το Πανεπιστήμιο Humboldt και προηγουμένως εργάστηκε ως ερευνητής στο Google Brain.
Η μουσική έχει sido μια σταθερή παράλληλη νήμα στη ζωή και των δύο. Ο Simon-Gabriel εκπαιδεύτηκε στο πιάνο, το όργανο και τη σύνθεση και έχει μιλήσει ανοιχτά για το πώς σχεδόν ακολούθησε μια επαγγελματική μουσική καριέρα. Ο Wenzel συνεχίζει να παίζει ηλεκτρική κιθάρα και να παράγει ηλεκτρονική μουσική ως μέρος μιας μπάντας στη Βερολίνο.
Αυτή η διπλή υπόβαθρο έχει διαμορφώσει την κουλτούρα και την τεχνική κατεύθυνση της Mirelo. Αντί να αντιμετωπίζουν τον ήχο ως δευτερεύον αποτέλεσμα, η ομάδα προσεγγίζει τον ήχο ως πρωταρχικό δημιουργικό μέσο, όπου η μαθηματική ακρίβεια και η εκφραστική νюάνς πρέπει να συνυπάρχουν.
Τι Ερχόμενο για τον Ήχο που Γεννιέται από τον AI
Η μακροπρόθεσμη φιλοδοξία της Mirelo εκτείνεται πολύ πέρα από την απλή αυτοματοποίηση. Η εταιρεία βλέπει την τεχνολογία της ως einen τρόπο να αφαιρέσει την τριβή από την δημιουργική δουλειά, χειριζόμενος καθήκοντα όπως η συγχρονισμός και ο χρόνος, ώστε οι καλλιτέχνες και οι σχεδιαστές ήχου να μπορέσουν να επικεντρωθούν στην έκφραση και την αφήγηση.
Καθώς το οπτικό περιεχόμενο γίνεται πιο προσωποποιημένο και διαδραστικό, ο ήχος θα πρέπει να εξελιχθεί παράλληλα. Τα παιχνίδια που προσαρμόζονται στη συμπεριφορά του παίκτη, τα βίντεο που παράγονται κατ’ απαίτηση και τα εικονικά περιβάλλοντα απαιτούν ήχο που μπορεί να ανταποκριθεί δυναμικά αντί να είναι σταθερός από πριν.
Προβλέποντας, τεχνολογίες όπως η Mirelo θα μπορούσαν να ξαναορίσουν τον τρόπο με τον οποίο ο ήχος δημιουργείται, μοιράζεται και βιώνεται. Αντί για στατικά soundtrack, ο ήχος μπορεί να γίνει ένας ζωντανός συνιστώνας του οπτικού μέσου, που παράγεται σε πραγματικό χρόνο για να ταιριάζει με το контέκστ, το συναισθήμα και την πρόθεση. Σε αυτό το μέλλον, ο ήχος δεν είναι πλέον ένα παρελθόν, αλλά ένα ολοκληρωμένο στρώμα που είναι υφανμένο απευθείας στο πώς οι ιστορίες λέγονται σε βίντεο, παιχνίδια, ταινίες και αναδυόμενα ψηφιακά κόσμους.












