1 00:00:09,679 --> 00:00:15,660 Buenas, esto es BIMPRAXIS, el podcast donde el 2 00:00:15,660 --> 00:00:17,739 BIM se encuentra con la inteligencia artificial. 3 00:00:20,379 --> 00:00:23,480 Exploramos la ciencia, la tecnología y el futuro 4 00:00:23,480 --> 00:00:26,460 desde el enfoque de la arquitectura, ingeniería y 5 00:00:26,460 --> 00:00:27,120 construcción. 6 00:00:28,839 --> 00:00:29,440 ¡Empezamos! 7 00:00:37,200 --> 00:00:40,219 Buenas, estamos ya en el episodio 45 y 8 00:00:40,219 --> 00:00:43,439 seguimos con la serie Herramientas Open Source Gratuitas, 9 00:00:43,460 --> 00:00:45,299 relacionadas, claro, con la IA. 10 00:00:45,299 --> 00:00:48,119 Hoy traemos una que se llama FireCrowl y 11 00:00:48,119 --> 00:00:49,399 ahora os explicamos qué es esto. 12 00:00:49,899 --> 00:00:51,799 Bienvenidos al podcast de BIMPRAXIS. 13 00:00:51,979 --> 00:00:54,240 Vamos a empezar, como siempre, por el principio. 14 00:00:54,799 --> 00:00:57,359 Cualquiera que esté metido en construir aplicaciones de 15 00:00:57,359 --> 00:01:01,140 inteligencia artificial sabe que todo, absolutamente todo, se 16 00:01:01,140 --> 00:01:01,960 basa en los datos. 17 00:01:02,240 --> 00:01:03,719 Son el combustible, sí. 18 00:01:04,180 --> 00:01:04,700 Exacto. 19 00:01:04,780 --> 00:01:07,500 Pero claro, conseguir esos datos en la web 20 00:01:07,500 --> 00:01:09,719 suele ser el primero y el mayor obstáculo. 21 00:01:09,980 --> 00:01:10,840 Uf, y tanto. 22 00:01:11,040 --> 00:01:14,620 Hay que extraerlos, luego limpiarlos, ponerlos en un 23 00:01:14,620 --> 00:01:15,280 formato que un... 24 00:01:15,299 --> 00:01:16,219 una IA pueda entender. 25 00:01:16,439 --> 00:01:18,120 Es un trabajo enorme. 26 00:01:18,560 --> 00:01:20,879 Y ahí es donde entran herramientas como la 27 00:01:20,879 --> 00:01:21,120 de hoy. 28 00:01:21,200 --> 00:01:21,739 Justo ahí. 29 00:01:21,819 --> 00:01:23,739 Ahí es donde entra FireCrowl. 30 00:01:24,000 --> 00:01:27,120 En esencia, es una API, una interfaz de 31 00:01:27,120 --> 00:01:29,859 programación, que está pensada para desarrolladores. 32 00:01:30,140 --> 00:01:32,599 Su misión es muy clara. 33 00:01:33,120 --> 00:01:36,540 Convertir cualquier sitio web en datos limpios y 34 00:01:36,540 --> 00:01:38,859 listos para un modelo de lenguaje grande, un 35 00:01:38,859 --> 00:01:39,439 LLM. 36 00:01:39,680 --> 00:01:41,680 O sea, que no es la típica herramienta 37 00:01:41,680 --> 00:01:43,180 visual de apuntar y hacer clic. 38 00:01:43,420 --> 00:01:44,099 Para nada. 39 00:01:45,299 --> 00:01:45,560 Un motor. 40 00:01:45,700 --> 00:01:47,219 Uno muy potente. 41 00:01:47,280 --> 00:01:49,519 Para sacar información de la web de forma 42 00:01:49,519 --> 00:01:50,200 programada. 43 00:01:50,439 --> 00:01:52,040 Vale, vamos a desgranar esto un poco. 44 00:01:52,359 --> 00:01:55,019 La idea principal, entonces, es que se encarga 45 00:01:55,019 --> 00:01:56,659 de las partes más frustrantes de lo que 46 00:01:56,659 --> 00:01:57,879 llamamos web scraping, ¿no? 47 00:01:58,079 --> 00:01:58,799 Eso es. 48 00:01:59,159 --> 00:02:02,340 Por ejemplo, lidiar con esas webs modernas que 49 00:02:02,340 --> 00:02:04,920 están llenas de JavaScript y cargan el contenido 50 00:02:04,920 --> 00:02:05,659 poco a poco. 51 00:02:05,819 --> 00:02:07,060 Que son un dolor de cabeza. 52 00:02:07,920 --> 00:02:08,400 Totalmente. 53 00:02:08,400 --> 00:02:10,580 O gestionar los proxys para que no te 54 00:02:10,580 --> 00:02:12,539 bloqueen el acceso a la primera de cambio. 55 00:02:12,819 --> 00:02:14,960 Se encarga de toda esa fontanería. 56 00:02:15,300 --> 00:02:18,199 De hecho, se centra en cuatro funciones principales. 57 00:02:18,400 --> 00:02:18,860 A ver. 58 00:02:19,060 --> 00:02:21,979 La primera sería scrape, que es raspar. 59 00:02:22,259 --> 00:02:24,639 Le das una única página web y te 60 00:02:24,639 --> 00:02:25,379 saca el contenido. 61 00:02:26,099 --> 00:02:27,319 ¿Y cómo te lo devuelve? 62 00:02:27,520 --> 00:02:29,379 Pues te lo da como un archivo Markdown 63 00:02:29,379 --> 00:02:32,400 ya limpio o en formato JSON, ya estructurado. 64 00:02:32,800 --> 00:02:33,319 Vale. 65 00:02:33,479 --> 00:02:35,680 Luego está crawl, que es rastrear. 66 00:02:35,759 --> 00:02:37,800 Esto ya es para recorrer un sitio web 67 00:02:37,800 --> 00:02:40,900 entero, todas sus páginas, y recopilar los datos 68 00:02:40,900 --> 00:02:41,780 del dominio completo. 69 00:02:42,759 --> 00:02:43,280 Entendido. 70 00:02:43,340 --> 00:02:45,120 La tercera es map, mapear. 71 00:02:45,300 --> 00:02:47,300 Te da un mapa rápido de todas las 72 00:02:47,300 --> 00:02:49,800 URLs de un sitio, para tener una visión 73 00:02:49,800 --> 00:02:50,900 general de la estructura. 74 00:02:51,199 --> 00:02:52,099 ¿Y la última? 75 00:02:52,379 --> 00:02:53,860 La última es extract. 76 00:02:54,240 --> 00:02:56,300 Y esta es la más avanzada, porque está 77 00:02:56,300 --> 00:02:57,180 impulsada por IA. 78 00:02:57,460 --> 00:03:00,099 Saca datos muy específicos y estructurados de una 79 00:03:00,099 --> 00:03:00,379 página. 80 00:03:00,780 --> 00:03:02,840 Has mencionado lo del Markdown limpio y me 81 00:03:02,840 --> 00:03:04,039 parece un detalle interesante. 82 00:03:04,520 --> 00:03:06,879 Porque puede parecer algo menor, pero es bastante 83 00:03:06,879 --> 00:03:07,719 importante, ¿verdad? 84 00:03:07,860 --> 00:03:08,460 Es fundamental. 85 00:03:08,979 --> 00:03:11,680 Reduce drásticamente la cantidad de tokens que envías 86 00:03:11,680 --> 00:03:12,460 al modelo de IA. 87 00:03:12,580 --> 00:03:12,879 Claro. 88 00:03:12,979 --> 00:03:14,520 ¿Y eso se traduce directamente? 89 00:03:15,300 --> 00:03:17,039 En un ahorro de costes, en las llamadas 90 00:03:17,039 --> 00:03:17,539 a la API. 91 00:03:17,900 --> 00:03:21,199 Y, muchas veces, también en un mejor rendimiento 92 00:03:21,199 --> 00:03:23,539 del modelo, porque le das la información mucho 93 00:03:23,539 --> 00:03:24,060 más clara. 94 00:03:24,280 --> 00:03:26,039 Aquí es donde la cosa se pone realmente 95 00:03:26,039 --> 00:03:26,599 interesante. 96 00:03:26,939 --> 00:03:28,340 En esa función extract. 97 00:03:28,939 --> 00:03:29,460 ¿Totalmente? 98 00:03:29,719 --> 00:03:31,780 La extracción de datos de toda la vida 99 00:03:31,780 --> 00:03:34,560 se basaba en apuntar a elementos muy concretos 100 00:03:34,560 --> 00:03:35,960 del diseño de una web, ¿no? 101 00:03:36,280 --> 00:03:36,800 Exacto. 102 00:03:36,939 --> 00:03:40,199 Y si un desarrollador cambiaba algo, por mínimo 103 00:03:40,199 --> 00:03:41,599 que fuera… Adiós a Scraper. 104 00:03:41,740 --> 00:03:42,599 Se rompía. 105 00:03:42,719 --> 00:03:44,800 Era increíblemente frágil. 106 00:03:45,300 --> 00:03:46,639 Una pesadilla de mantener. 107 00:03:46,979 --> 00:03:49,919 Y la función extract de Firecrawl soluciona eso. 108 00:03:50,039 --> 00:03:50,479 ¿Cómo? 109 00:03:50,599 --> 00:03:52,500 Pues lo soluciona cambiando el enfoque. 110 00:03:52,740 --> 00:03:55,740 En lugar de reglas fijas, usa inteligencia artificial. 111 00:03:56,240 --> 00:03:59,199 El desarrollador le da una URL y una 112 00:03:59,199 --> 00:04:00,620 instrucción en lenguaje natural. 113 00:04:00,919 --> 00:04:04,620 Algo como, obtén los nombres, cargos y correos 114 00:04:04,620 --> 00:04:05,620 del equipo directivo. 115 00:04:05,800 --> 00:04:06,099 Ah, vale. 116 00:04:06,219 --> 00:04:07,539 Le hablas como una persona. 117 00:04:07,759 --> 00:04:08,319 Justo. 118 00:04:08,319 --> 00:04:11,240 Y, además, defines la estructura JSON en la 119 00:04:11,240 --> 00:04:12,580 que quieres recibir esos datos. 120 00:04:12,979 --> 00:04:15,280 Y la IA de Firecrawl analiza la persona. 121 00:04:15,860 --> 00:04:18,160 Entiende lo que le pides, encuentra la información 122 00:04:18,160 --> 00:04:19,600 y te la da ya estructurada. 123 00:04:19,860 --> 00:04:22,360 La ventaja principal, entonces, es la resiliencia. 124 00:04:22,680 --> 00:04:23,500 Esa es la palabra. 125 00:04:23,740 --> 00:04:26,000 Como entiende el significado de los datos, se 126 00:04:26,000 --> 00:04:28,120 puede adaptar a los cambios de diseño sin 127 00:04:28,120 --> 00:04:29,519 tener que reescribir el código. 128 00:04:29,939 --> 00:04:32,439 Y sabemos qué tecnología hay detrás de esto, 129 00:04:32,500 --> 00:04:32,740 ¿verdad? 130 00:04:32,860 --> 00:04:33,560 ¿Qué motor usa? 131 00:04:33,740 --> 00:04:34,600 Sí, sí, que lo sabemos. 132 00:04:34,759 --> 00:04:37,959 Usan Gemini 2 .5 Pro, de Google, para 133 00:04:37,959 --> 00:04:39,459 potenciar este motor de extracción. 134 00:04:39,600 --> 00:04:39,920 Vaya. 135 00:04:40,100 --> 00:04:43,160 De hecho, el cofundador de Firecrawl, Eric Ciarla, 136 00:04:43,300 --> 00:04:45,399 dijo que este modelo fue lo que… Hizo 137 00:04:45,399 --> 00:04:47,160 factible todo el proyecto. 138 00:04:47,319 --> 00:04:47,779 ¿Ah, sí? 139 00:04:47,980 --> 00:04:48,180 Sí. 140 00:04:48,220 --> 00:04:50,540 Parece que otros modelos no manejaban bien la 141 00:04:50,540 --> 00:04:52,279 complejidad del contenido web real. 142 00:04:52,540 --> 00:04:53,720 ¿Y qué tal la precisión? 143 00:04:53,879 --> 00:04:56,160 Pues en sus pruebas internas dicen que Gemini 144 00:04:56,160 --> 00:04:59,160 2 .5 Pro alcanzó una precisión del 98%. 145 00:04:59,160 --> 00:05:02,459 Un 98 % es una cifra altísima. 146 00:05:02,620 --> 00:05:02,819 Sí. 147 00:05:02,939 --> 00:05:04,680 Puede ser un poco confuso. 148 00:05:04,759 --> 00:05:06,920 No hay un único modelo, sino dos. 149 00:05:07,180 --> 00:05:08,319 ¿Dos sistemas diferentes? 150 00:05:08,939 --> 00:05:09,459 Exacto. 151 00:05:09,459 --> 00:05:11,699 Y hay que entender los dos para calcular 152 00:05:11,699 --> 00:05:12,860 los costes reales. 153 00:05:13,019 --> 00:05:15,279 Por un lado, está el modelo de credibilidad. 154 00:05:15,300 --> 00:05:18,339 Este se aplica a las funciones básicas de 155 00:05:18,339 --> 00:05:19,300 scrape y crawl. 156 00:05:19,500 --> 00:05:21,160 El más predecible, imagino. 157 00:05:21,240 --> 00:05:21,600 Sí. 158 00:05:21,759 --> 00:05:24,180 Una llamada a la API o una página 159 00:05:24,180 --> 00:05:26,360 rastreada suele costar un crédito. 160 00:05:26,420 --> 00:05:29,379 Los planes van desde uno gratuito con 500 161 00:05:29,379 --> 00:05:32,019 créditos, que se dan una sola vez, hasta 162 00:05:32,019 --> 00:05:34,519 planes de pago como el hobby, por 19 163 00:05:34,519 --> 00:05:37,139 dólares, que te da 3 .000 créditos al 164 00:05:37,139 --> 00:05:37,319 mes. 165 00:05:37,620 --> 00:05:38,019 Vale. 166 00:05:38,120 --> 00:05:38,819 Hasta ahí bien. 167 00:05:39,019 --> 00:05:40,220 ¿Y el segundo modelo? 168 00:05:40,379 --> 00:05:41,879 Pues aquí está el detalle crucial. 169 00:05:42,339 --> 00:05:45,279 La función de extracción con IA, la de 170 00:05:45,279 --> 00:05:48,360 extract, no utiliza el sistema de créditos. 171 00:05:48,439 --> 00:05:48,600 Ah. 172 00:05:48,699 --> 00:05:52,560 Se factura aparte, basándose en tokens, muy parecido 173 00:05:52,560 --> 00:05:54,120 a cómo pagas por las APIs de OpenAI 174 00:05:54,120 --> 00:05:54,660 o Anthropic. 175 00:05:54,860 --> 00:05:57,740 O sea que es una suscripción completamente separada. 176 00:05:58,199 --> 00:05:58,639 Completamente. 177 00:05:58,819 --> 00:06:01,620 Si alguien contrata, no sé, el plan estándar 178 00:06:01,620 --> 00:06:04,560 para raspar datos, pensando que lo tiene todo… 179 00:06:04,560 --> 00:06:05,800 Se va a llevar una sorpresa. 180 00:06:06,100 --> 00:06:08,699 Necesita comprar un plan adicional solo para la 181 00:06:08,699 --> 00:06:09,600 función de extracción. 182 00:06:09,819 --> 00:06:11,600 Es un detalle que es fácil pasar por 183 00:06:11,600 --> 00:06:13,920 alto, la verdad, y que puede generar costes 184 00:06:13,920 --> 00:06:14,480 inesperados. 185 00:06:14,740 --> 00:06:15,220 Desde luego. 186 00:06:15,540 --> 00:06:18,399 Los planes para extract empiezan en 89 dólares 187 00:06:18,399 --> 00:06:20,720 al mes, por 18 millones de tokens al 188 00:06:20,720 --> 00:06:21,920 año, y de ahí para arriba. 189 00:06:22,240 --> 00:06:24,019 Entonces, ¿qué significa todo esto? 190 00:06:24,259 --> 00:06:26,920 Que la suscripción a Firecrawl es en realidad 191 00:06:26,920 --> 00:06:28,199 solo el punto de partida. 192 00:06:28,379 --> 00:06:28,939 Correcto. 193 00:06:28,939 --> 00:06:31,800 Al construir una solución de IA personalizada, hay 194 00:06:31,800 --> 00:06:33,839 otros costes, y son significativos. 195 00:06:33,980 --> 00:06:36,000 Como por ejemplo… El tiempo de ingeniería. 196 00:06:36,120 --> 00:06:37,800 Suele ser el mayor gasto. 197 00:06:38,120 --> 00:06:42,899 Necesitas desarrolladores cualificados para construir la aplicación, probarla, 198 00:06:43,040 --> 00:06:43,779 mantenerla. 199 00:06:43,980 --> 00:06:44,519 Claro. 200 00:06:44,740 --> 00:06:45,699 Las horas de desarrollo. 201 00:06:46,019 --> 00:06:47,819 Luego, los costes del LLM. 202 00:06:48,420 --> 00:06:50,839 Firecrawl te da los datos, pero todavía tienes 203 00:06:50,839 --> 00:06:53,240 que pagar a un proveedor como OpenAI o 204 00:06:53,240 --> 00:06:54,879 Anthropic para que los procesen. 205 00:06:55,019 --> 00:06:56,660 Y la infraestructura, donde corre todo. 206 00:06:56,939 --> 00:06:57,519 Por supuesto. 207 00:06:57,740 --> 00:06:59,339 Los costes de infraestructura. 208 00:06:59,540 --> 00:07:02,519 Necesitas un sitio donde alojar la aplicación, bases 209 00:07:02,519 --> 00:07:04,879 de datos vectoriales como Pinecone, etc. 210 00:07:05,240 --> 00:07:07,040 Y también he leído que puede haber problemas 211 00:07:07,040 --> 00:07:07,839 de escalabilidad. 212 00:07:08,240 --> 00:07:11,779 Sí, algunos usuarios han señalado que en rastreos 213 00:07:11,779 --> 00:07:13,699 a gran escala es muy fácil agotar los 214 00:07:13,699 --> 00:07:14,279 créditos. 215 00:07:14,740 --> 00:07:16,620 Y eso te puede llevar a tarifas por 216 00:07:16,620 --> 00:07:18,779 exceso de uso que disparan la factura. 217 00:07:18,959 --> 00:07:21,720 En resumen, Firecrawl te da las materias primas, 218 00:07:21,720 --> 00:07:23,240 y de excelente calidad por lo que parece. 219 00:07:23,439 --> 00:07:23,680 Sí. 220 00:07:23,759 --> 00:07:25,800 Pero la empresa todavía tiene que construir la 221 00:07:25,800 --> 00:07:28,720 fábrica, desplegarla y mantenerla para usar esos datos. 222 00:07:29,000 --> 00:07:30,019 Esa es la disyuntiva. 223 00:07:30,459 --> 00:07:30,980 Exactamente. 224 00:07:31,300 --> 00:07:33,560 Las fuentes lo comparan con un enfoque de 225 00:07:33,560 --> 00:07:34,920 plataforma todo en uno. 226 00:07:35,279 --> 00:07:38,519 Es la diferencia entre comprar las piezas para 227 00:07:38,519 --> 00:07:41,000 montar el coche… O comprar el coche ya 228 00:07:41,000 --> 00:07:41,540 fabricado. 229 00:07:41,920 --> 00:07:42,439 Justo. 230 00:07:42,540 --> 00:07:44,399 Son dos filosofías distintas. 231 00:07:44,740 --> 00:07:47,160 Una es para quien quiere construir algo a 232 00:07:47,160 --> 00:07:49,420 medida, desde cero, y la otra es para 233 00:07:49,420 --> 00:07:52,040 quien busca resolver un problema de negocio concreto 234 00:07:52,040 --> 00:07:52,860 de forma rápida. 235 00:07:53,079 --> 00:07:53,420 Vale. 236 00:07:53,500 --> 00:07:56,839 Entonces, para dejarlo claro, ¿quién es el usuario 237 00:07:56,839 --> 00:07:58,379 ideal de esta herramienta? 238 00:07:58,500 --> 00:08:01,839 Es ideal para equipos técnicos que están construyendo 239 00:08:01,839 --> 00:08:04,399 aplicaciones de IA personalizadas desde cero. 240 00:08:04,759 --> 00:08:05,360 ¿Desarrolladores? 241 00:08:05,839 --> 00:08:06,439 ¿Ingenieros? 242 00:08:06,620 --> 00:08:07,079 Sí. 243 00:08:07,259 --> 00:08:09,759 De hecho, se integra con herramientas que ya 244 00:08:09,759 --> 00:08:13,100 usan, como Landchain, donde funciona como un cargador 245 00:08:13,100 --> 00:08:13,959 de documentos. 246 00:08:13,980 --> 00:08:14,379 Sí. 247 00:08:14,519 --> 00:08:14,720 De hecho, se integra con herramientas que ya 248 00:08:14,720 --> 00:08:14,720 usan, como Landchain, donde funciona como un cargador 249 00:08:14,720 --> 00:08:14,720 de documentos. 250 00:08:14,720 --> 00:08:16,860 Además, al ser de código abierto, pues el 251 00:08:16,860 --> 00:08:19,920 código es transparente y la comunidad puede contribuir. 252 00:08:20,000 --> 00:08:22,660 O incluso puedes autoalojar la herramienta en tus 253 00:08:22,660 --> 00:08:23,439 propios servidores. 254 00:08:23,779 --> 00:08:25,560 Que eso para muchas empresas es clave. 255 00:08:25,759 --> 00:08:26,300 Fundamental. 256 00:08:26,500 --> 00:08:28,120 ¿Y para qué se está usando en el 257 00:08:28,120 --> 00:08:28,620 mundo real? 258 00:08:28,860 --> 00:08:30,720 ¿Qué casos de uso destacan? 259 00:08:31,300 --> 00:08:33,019 Pues… son bastante variados. 260 00:08:33,259 --> 00:08:35,919 Uno muy claro es crear asistentes de IA 261 00:08:35,919 --> 00:08:37,019 más inteligentes. 262 00:08:37,559 --> 00:08:40,340 Alimentar chatbots con contenido web que sea preciso 263 00:08:40,340 --> 00:08:41,360 y en tiempo real. 264 00:08:41,580 --> 00:08:41,940 Vale. 265 00:08:42,360 --> 00:08:44,580 Otro es el enriquecimiento de leads. 266 00:08:44,720 --> 00:08:47,860 Mejorar los datos de ventas con información extraída 267 00:08:47,860 --> 00:08:49,779 de la web sobre posibles clientes. 268 00:08:49,799 --> 00:08:51,559 Eso es muy potente para un equipo comercial. 269 00:08:51,960 --> 00:08:52,419 Muchísimo. 270 00:08:52,600 --> 00:08:54,759 Y también para la investigación profunda. 271 00:08:54,879 --> 00:08:57,820 Para extraer información exhaustiva para análisis de mercado 272 00:08:57,820 --> 00:08:59,220 o para temas académicos. 273 00:08:59,559 --> 00:09:01,299 Y no hay que olvidar que, por debajo, 274 00:09:01,340 --> 00:09:04,580 gestiona automáticamente tareas complejas, como el manejo de 275 00:09:04,580 --> 00:09:07,860 proxies, contenido bloqueado por Javascript, e incluso puede 276 00:09:07,860 --> 00:09:10,720 analizar archivos PDF y 12x que encuentre en 277 00:09:10,720 --> 00:09:11,039 la web. 278 00:09:11,220 --> 00:09:14,700 Entonces, como conclusión, Firecrawl es una herramienta que, 279 00:09:14,700 --> 00:09:15,820 además de ser una herramienta potente y muy 280 00:09:15,820 --> 00:09:18,299 bien diseñada, pero para una tarea muy, muy 281 00:09:18,299 --> 00:09:19,019 específica. 282 00:09:19,019 --> 00:09:22,039 Sí, convertir la web en datos estructurados para 283 00:09:22,039 --> 00:09:23,019 los modelos de IA. 284 00:09:23,200 --> 00:09:25,440 Si se cuenta con el equipo de ingeniería, 285 00:09:25,460 --> 00:09:27,840 con el presupuesto y con el tiempo para 286 00:09:27,840 --> 00:09:30,600 construir una solución a medida, parece una pieza 287 00:09:30,600 --> 00:09:32,419 excelente para el puzzle tecnológico. 288 00:09:32,600 --> 00:09:34,980 Pero si el objetivo es resolver un problema 289 00:09:34,980 --> 00:09:38,720 de negocio, rápido y fiable, es fundamental entender 290 00:09:38,720 --> 00:09:41,700 el coste y el esfuerzo total, no sólo 291 00:09:41,700 --> 00:09:42,879 el precio de la herramienta. 292 00:09:42,879 --> 00:09:46,080 La elección depende enteramente del objetivo final. 293 00:09:46,340 --> 00:09:49,059 Y para terminar, un último apunte que invita 294 00:09:49,059 --> 00:09:49,840 a pensar en el futuro. 295 00:09:50,620 --> 00:09:53,600 Firecrawl está experimentando con un framework de agentes 296 00:09:53,600 --> 00:09:54,980 llamado Fire1. 297 00:09:55,299 --> 00:09:56,019 Ah, sí. 298 00:09:56,399 --> 00:09:59,620 Usa Gemini 2 .5 Pro para interpretar la 299 00:09:59,620 --> 00:10:01,759 intención del usuario y navegar por la web 300 00:10:01,759 --> 00:10:02,700 de forma autónoma. 301 00:10:02,879 --> 00:10:04,899 Y esto apunta a un futuro muy interesante. 302 00:10:05,279 --> 00:10:07,279 Ya no sólo pedimos datos de una página, 303 00:10:07,460 --> 00:10:09,039 sino que le damos a una IA un 304 00:10:09,039 --> 00:10:09,379 objetivo. 305 00:10:09,899 --> 00:10:10,419 Exacto. 306 00:10:10,419 --> 00:10:12,679 Y que ella averigüe por sí misma, cómo 307 00:10:12,679 --> 00:10:15,440 navegar, hacer clic y extraer lo que necesita. 308 00:10:15,759 --> 00:10:17,820 La pregunta que queda en el aire es, 309 00:10:17,899 --> 00:10:20,860 ¿qué pasaría si en lugar de programar un 310 00:10:20,860 --> 00:10:23,960 scraper, simplemente le diéramos a una IA un 311 00:10:23,960 --> 00:10:26,820 objetivo de negocio y la dejáramos navegar por 312 00:10:26,820 --> 00:10:27,980 la web para cumplirlo? 313 00:10:28,220 --> 00:10:30,220 Y así hemos llegado al final por hoy. 314 00:10:30,279 --> 00:10:32,539 Os recordamos que detrás de las voces sintéticas 315 00:10:32,539 --> 00:10:35,139 que se escuchan en estos episodios, sí, son 316 00:10:35,139 --> 00:10:37,639 generadas por IA, en concreto por Notebook LM, 317 00:10:37,899 --> 00:10:40,679 pues se encuentra un humano con duodeno, pulgares 318 00:10:40,679 --> 00:10:42,299 y algún michelin, entre otras cosas. 319 00:10:42,379 --> 00:10:45,240 Estamos hablando de Julio Pablo Vázquez, el responsable 320 00:10:45,240 --> 00:10:46,980 de elegir los temas, el enfoque y hacer 321 00:10:46,980 --> 00:10:47,840 de hombre orquesta. 322 00:10:47,940 --> 00:10:50,360 Si se escucha algún error, pedimos disculpas en 323 00:10:50,360 --> 00:10:51,799 su nombre, porque lo más probable es que 324 00:10:51,799 --> 00:10:53,059 se trate de un error humano. 325 00:10:53,320 --> 00:10:54,340 Hasta la próxima, amigos. 326 00:11:05,100 --> 00:11:07,200 Y hasta aquí el episodio de hoy. 327 00:11:07,360 --> 00:11:09,139 Muchas gracias por tu atención. 328 00:11:18,769 --> 00:11:20,570 Esto es BIMPRAXIS. 329 00:11:20,830 --> 00:11:23,370 Nos escuchamos en el próximo episodio.