заглушки Сем Стоун, прем'єр-міністр, ціноутворення в Opendoor - Серія інтерв'ю - Unite.AI
Зв'язатися з нами

інтерв'ю

Сем Стоун, прем’єр-міністр, ціноутворення у Opendoor – серія інтерв’ю

mm
оновлений on

Сем захоплений створенням продуктів на перетині фінансів і машинного навчання. На даний момент він є керівником продукту групи ціноутворення в Відкриті двері, стартап останньої стадії, який використовує алгоритми для миттєвої купівлі та продажу будинків, позбавляючи власників будинків від клопоту та невизначеності, пов’язаної з розміщенням свого житла та хостингу.

Що спочатку привернуло вас до машинного навчання та науки про дані?

Після коледжу я працював у великій фірмі професійних послуг, яка найняла сотні випускників коледжу на ту саму посаду початкового рівня. Коли я почав наймати, я був вражений і наляканий тим, наскільки сильно різнилися думки людей у ​​фірмі щодо того, які якості кандидата привели до успіху. Це здавалося справді важливою проблемою, де бракувало ясності. Але я був схвильований тим фактом, що ми мали достатньо даних про колишніх претендентів на роботу та результати нових наймів, які ніколи не були пов’язані між собою чи глибоко проаналізовані. Тож я почав працювати над цим, розглядаючи це як статистичну проблему, використовуючи такі базові інструменти, як лінійна регресія. Згодом проект переріс у стартап, а методи, які ми використовували, стали більш витонченими. Наприклад, ми хотіли безпосередньо обробляти неструктуроване аудіо та текст з інтерв’ю, і це спонукало нас застосувати більш потужні моделі машинного навчання, такі як нейронні мережі.

Чи могли б ви обговорити автоматизовану модель оцінки Opendoor (OVM) і те, як вона розраховує оціночну вартість власності?

Модель оцінки під відкритим небом (OVM) є основною частиною нашого бізнесу та використовується для багатьох ціноутворюючих програм.

У багатьох відношеннях OVM поводиться так само, як типовий покупець чи продавець — він переглядає околиці, включаючи типи та ціни нещодавно проданих будинків. Однак, коли справа доходить до ціни на будинки, особливо враховуючи різноманітність будинків у США, недостатньо дивитися лише на ціни порівнянних продажів. Це набагато складніше. Ми враховуємо різноманітні фактори, починаючи від квадратних метрів і площі заднього двору до кількості ванних кімнат і спалень, планування, завантажених доріг, модернізації тощо. OVM подається з безлічі джерел даних, включаючи інформацію про податок на нерухомість, ринкові тенденції, а також численні сигнали, що стосуються окремих будинків і сусідів. Ми також шукаємо попередні коригування будинків, зроблені людиною, щоб обчислити середнє значення коригування. І ми можемо уточнити ці значення за допомогою масштабу. У міру того як ми збираємо більше даних про людське коригування для ринків, набір даних зростає та покращує продуктивність OVM. Це цикл зворотного зв’язку, який з часом постійно покращує продуктивність.

Окрім високої точності, він має працювати з низькою затримкою та високим покриттям. Це означає, що кожного разу, коли ми виходимо на новий ринок, нам потрібно розширювати можливості OVM, щоб гарантувати, що він може обслуговувати власників будинків у різних районах і типах будинків.

Які різні методології машинного навчання використовуються?

Коли ми вперше почали створювати OVM, ми покладалися переважно на лінійні статистичні моделі, щоб краще зрозуміти процес прийняття рішень нашими покупцями та продавцями. Але з часом OVM розвинувся і тепер базується на нейронній мережі, зокрема на архітектурі під назвою Сіамська мережа. Ми використовуємо це, щоб впроваджувати поведінку покупців і продавців, включаючи вибір порівнянних будинків, їх коригування та зважування. Це життєво важливо, оскільки ми виявили, що для досягнення високої точності моделі повинні відображати ці ключові кроки, яких учасники ринку дотримуються у своїй архітектурі.

Одна з багатьох переваг використання нейронної мережі полягає в тому, що вона має точність і гнучкість для аналізу даних на всіх ринках і виявлення детальних локальних нюансів. У результаті, коли Opendoor запускається на новому ринку або розширює запаси на існуючому ринку, ми можемо використовувати ту саму модель, обходячи більшу частину роботи з інженерної інфраструктури, яка виникає в результаті створення нової виробничої моделі. Натомість ми запускаємо нові дані через існуючу модель, що значно скорочує час, який наші інженери витрачають на процес.

Окрім нейронних мереж, у Opendoor ми використовуємо багато інших методологій машинного навчання. Це включає, але не обмежується, дерева рішень, методи кластеризації, системи ранжирування та алгоритми оптимізації.

Opendoor покладається на величезну кількість даних. Звідки ці дані збираються?

Дані, які наші алгоритми вважають найбільш цінними, часто є даними, які знайти найважче. Це дані, які ми створюємо самостійно або розробляємо через відносини власності. Ми використовуємо комбінацію внутрішніх даних і даних про нерухомість третьої сторони, включаючи дані зі списків, як-от дата продажу, кількість спалень і ванних кімнат, квадратні метри тощо. Крім того, ми розглядаємо особливості, які вказують на унікальність будинків, а це те, що може забезпечити лише людський досвід, наприклад, освітлення, вуличний шум, якість техніки та обробки та багато іншого. Ми збираємо дані з будинків, які вже є на ринку, а також із будинків, які не знаходяться на ринку, власники яких поділилися з нами інформацією.

Чи могли б ви обговорити деякі зусилля Opendoor, спрямовані на підвищення швидкості та надійності інфраструктури, яка забезпечує прийом необроблених даних?

Перед виходом на новий ринок ми збираємо багаторічні історичні дані. Високоякісні дані життєво важливі для навчання наших алгоритмів і наших місцевих операторів, щоб переконатися, що вони розуміють варіації на цьому ринку. Щоб підвищити швидкість, якість і надійність, ми створили гнучкі інструменти відображення даних і інструменти для автоматичної оцінки охоплення нових полів даних. З цими інструментами нам знадобляться лічені години або дні, щоб отримати та перевірити великі обсяги історичних даних про операції з нерухомістю замість тижнів.

Ще одна стратегія, у яку ми інвестували, — це проактивний автоматизований моніторинг якості даних. Ми налаштували системи, які перевіряють розподіл даних, які ми отримуємо та перетворюємо на кожному кроці процесу, у режимі реального часу. Наприклад, якщо ми очікуємо, що на певному ринку в середньому 20% нових оголошень є квартирами, а сьогодні 50% нових оголошень класифікуються як квартири, це викличе попередження для інженера для дослідження.

Як експертна людська оцінка поєднується з алгоритмами машинного навчання для створення циклів зворотного зв’язку для постійного покращення продуктивності?

Наші власні експерти з ціноутворення відіграють важливу роль у прийнятті рішень щодо ціноутворення, працюючи разом із нашими алгоритмами. Там, де машини все ще мають сліпі зони, наші досвідчені оператори заповнюють їх, і ми покладаємося на них на різних етапах. Наприклад, вони додають або перевіряють вхідні дані, як-от якість певних проектів реконструкції. Вони приймають проміжні рішення про те, які функції важко оцінити, і вони також приймають рішення щодо користувачів, наприклад, які пропозиції ми повинні прийняти. Людський фактор завжди матиме вирішальне значення для нашої стратегії, і ми вважаємо, що найкраще поєднати експертів і алгоритми.

Чи могли б ви обоє дати визначення ретесту та обговорити його важливість на Opendoor?

Ретротестування — це спосіб оцінки точності моделі за допомогою історичних даних. Наприклад, ми можемо навчити Opendoor Valuation Model на даних із січня 2015 року по січень 2021 року. У цьому контексті «навчання» означає, що ми передаємо в модель історичні дані, як-от атрибути житла, і результати, як-от ціни на продане житло. І, у свою чергу, модель вивчає зв’язок між вхідними ресурсами та результатами. Потім ми беремо цю модель, яка відображає ті нещодавно вивчені зв’язки, і вводимо інший набір історичних даних, скажімо, з лютого 2021 року. Оскільки дані історичні, ми знаємо результати та можемо виміряти, наскільки вони відрізняються від передбачення.

Цей процес дуже важливий для Opendoor, і він використовується для всіх наших продуктів машинного навчання. Це зменшує ризик проблеми, яка називається переобладнанням, коли модель машинного навчання визначає шаблони в історичних даних, яких насправді немає. Наприклад, помилкові кореляції, які не допомагають у прогнозуванні в реальному світі. Це також позбавляє нас від проведення дорогих реальних A/B-тестів нових продуктів і стратегій, які можна виключити на основі історичних даних.

Чи є ще щось, чим ви хотіли б поділитися про Opendoor?

Ми наймаємо! Якщо вам цікаво будувати майбутнє нерухомості та/або працювати на стику фінансових технологій, машинного навчання та споживчих товарів, подайте заявку! У нас є відкриті посади в різних підрозділах і містах. Перегляньте нашу сторінку кар’єри тут.

Дякую за чудове інтерв’ю, читачі, які хочуть дізнатися більше, повинні відвідати Відкриті двері.

Партнер-засновник unite.AI і член Технологічна рада Forbes, Антуан - це а футурист який захоплений майбутнім ШІ та робототехніки.

Він також є засновником Securities.io, веб-сайт, який зосереджується на інвестиціях у революційні технології.