Jacob Jackson apostó por la inteligencia artificial al principio de su carrera.
Jackson cofundó Tabnine, el asistente de codificación de IA que llegó a recaudar cerca de 60 millones de dólares en capital riesgo, cuando aún era estudiante de informática en la Universidad de Waterloo. Tras vender Tabnine a Codata en 2019 (durante sus exámenes finales), Jackson se unió a OpenAI como becario, donde trabajó hasta 2022.
Fue en esa coyuntura cuando Jackson tuvo el impulso de crear una empresa de nuevo, una centrada en apoyar los flujos de trabajo comunes de los desarrolladores.
«En los años transcurridos desde que creé Tabnine, herramientas como ChatGPT y GitHub Copilot han cambiado la forma de trabajar de los desarrolladores», explica Jackson. «Es un momento realmente emocionante para trabajar en herramientas para desarrolladores porque la tecnología subyacente ha mejorado mucho desde que empecé Tabnine, lo que ha llevado a muchos más desarrolladores a interesarse en el uso de herramientas de IA para acelerar su flujo de trabajo».
Así que Jackson puso en marcha Supermaven, una plataforma de codificación de IA similar a Tabnine, pero con algunas mejoras técnicas y de calidad de vida.
El modelo interno de IA generativa de Supermaven, Babble, puede entender mucho código a la vez, dice Jackson, gracias a una ventana contextual de un millón de tokens. (En ciencia de datos, los tokens son fragmentos subdivididos de datos en bruto, como las sílabas «fan», «tas» y «tic» en la palabra «fantástico»).
El contexto de un modelo, o ventana de contexto, se refiere a los datos de entrada (por ejemplo, código) que el modelo tiene en cuenta antes de generar la salida (por ejemplo, código adicional). Un contexto largo puede evitar que los modelos «olviden» el contenido de documentos y datos recientes, y que se desvíen del tema y extrapolen erróneamente.
«Nuestra gran ventana de contexto ayuda a reducir la frecuencia de las alucinaciones porque permite al modelo extraer respuestas del contexto en situaciones en las que, de otro modo, tendría que adivinar», afirma Jackson.
Sin duda, un millón de fichas es una ventana de contexto grande. Pero no es mayor que la de la startup de codificación de IA Magic, que es de 100 millones de tokens. Por su parte, la herramienta Code Assist de Google, presentada recientemente, iguala el contexto de Supermaven con 1 millón de tokens.
¿Cuáles son las ventajas de Supermaven frente a sus rivales? Jackson afirma que Babble tiene menos latencia gracias a una «nueva arquitectura neuronal». No quiso dar más detalles que decir que la arquitectura se desarrolló «desde cero».
«Supermaven dedica entre 10 y 20 segundos a procesar el repositorio de código de un desarrollador para familiarizarse con sus API y las convenciones exclusivas de su base de código», afirma Jackson. «Con una latencia más baja gracias a nuestra infraestructura interna de servicio de modelos, nuestra herramienta sigue respondiendo mientras trabaja con las largas indicaciones que vienen con grandes bases de código».
El mercado de las herramientas de codificación de IA es amplio y está en crecimiento, y Polaris Research proyecta que tendrá un valor de 27.170 millones de dólares en 2032. La gran mayoría de los encuestados en la última encuesta de desarrollo de GitHub dicen que han adoptado herramientas de IA de alguna forma, y más de 1,8 millones de personas, y ~ 50.000 empresas, están pagando por GitHub Copilot.
Sin embargo, Supermaven, junto con otras startups competidoras como Cognition, Anysphere, Poolside, Codeium y Augment, tiene que superar retos éticos y legales.
Por ejemplo , Apple prohibió el año pasado a sus empleados el uso de Copilot por temor a que se filtraran datos confidenciales. Se ha demostrado que algunas herramientas de generación de código entrenadas con licencias restrictivas o código protegido por derechos de autor regurgitan ese código cuando se les pide de una determinada manera, lo que plantea un riesgo de responsabilidad (es decir, los desarrolladores que incorporan el código podrían ser demandados). Además, como la IA comete errores, las herramientas de codificación asistida pueden hacer que se introduzca más código erróneo e inseguro en las bases de código.
Jackson afirma que Supermaven no utiliza datos de clientes para entrenar sus modelos. Admitió, sin embargo, que la empresa retiene datos durante una semana para «hacer que el sistema sea rápido y reactivo», dijo. En cuanto al tema de los derechos de autor, Jackson no negó explícitamente que Babble se entrenara con código protegido por la propiedad intelectual, solo que «se entrenó casi exclusivamente con código disponible públicamente en lugar de con un raspado de la Internet pública» para «reducir la exposición a contenidos tóxicos durante el entrenamiento».
Los clientes no parecen disuadidos. Más de 35.000 desarrolladores utilizan Supermaven, según Jackson, y una parte considerable paga por los planes premium Pro (10 dólares al mes) y Team (10 dólares al mes por uso). Los ingresos anuales recurrentes de Supermaven alcanzaron el millón de dólares este año gracias a una base de usuarios que se ha multiplicado por tres desde el lanzamiento de la plataforma en febrero.
Este impulso atrajo la atención de las empresas de capital riesgo.
Supermaven ha anunciado esta semana su primera financiación externa: una ronda de 12 millones de dólares liderada por Bessemer Venture Partners e inversores ángeles de alto perfil, entre ellos el cofundador de OpenAI John Schulman y el cofundador de Perplexity Denis Yarats. Jackson dice que el plan es gastar el dinero en la contratación de desarrolladores (Supermaven tiene un equipo de cinco personas en la actualidad) y el desarrollo del editor de texto de Supermaven, que se encuentra actualmente en fase beta.
«Tenemos previsto crecer de forma significativa hasta finales de año», añade. «A pesar de los vientos en contra para la tecnología en general, el mercado de copilotos de codificación ha crecido rápidamente. Nuestro crecimiento desde nuestro lanzamiento en febrero, así como nuestra ronda de financiación más reciente, nos posicionan bien de cara al próximo año».