1
00:00:09,679 --> 00:00:15,660
Buenas, esto es BIMPRAXIS, el podcast donde el

2
00:00:15,660 --> 00:00:17,739
BIM se encuentra con la inteligencia artificial.

3
00:00:20,339 --> 00:00:23,480
Exploramos la ciencia, la tecnología y el futuro

4
00:00:23,480 --> 00:00:26,460
desde el enfoque de la arquitectura, ingeniería y

5
00:00:26,460 --> 00:00:27,120
construcción.

6
00:00:28,800 --> 00:00:29,440
¡Empezamos!

7
00:00:36,990 --> 00:00:39,770
Muy buenas, bienvenidas, bienvenidos a un nuevo episodio

8
00:00:39,770 --> 00:00:40,329
de BIMPRAXIS.

9
00:00:40,530 --> 00:00:43,969
Hoy os traemos OpenRouter frente a Requesti, la

10
00:00:43,969 --> 00:00:45,969
gran batalla de los conectores de IA en

11
00:00:45,969 --> 00:00:46,729
2026.

12
00:00:46,729 --> 00:00:48,990
Y bueno, la verdad es que el material

13
00:00:48,990 --> 00:00:51,070
que tenemos sobre la mesa hoy es tela.

14
00:00:51,210 --> 00:00:53,950
O sea, procede de un análisis exhaustivo del

15
00:00:53,950 --> 00:00:56,509
canal Toby Tiches y pone el foco en

16
00:00:56,509 --> 00:00:59,810
algo que parece, no sé, puramente técnico, pero

17
00:00:59,810 --> 00:01:00,469
que lo cambia todo.

18
00:01:00,729 --> 00:01:01,109
Todo.

19
00:01:01,409 --> 00:01:03,490
Es que cambia por completo las reglas del

20
00:01:03,490 --> 00:01:05,230
juego en el desarrollo de software hoy en

21
00:01:05,230 --> 00:01:05,450
día.

22
00:01:06,269 --> 00:01:06,709
Exacto.

23
00:01:06,709 --> 00:01:08,829
Y por eso, la promesa para quienes nos

24
00:01:08,829 --> 00:01:10,989
escuchan es que, al terminar este análisis a

25
00:01:10,989 --> 00:01:14,129
fondo, van a tener clarísimo qué infraestructura elegir.

26
00:01:14,209 --> 00:01:16,269
Da igual si quieren montar un proyecto personal

27
00:01:16,269 --> 00:01:16,709
el fin de semana.

28
00:01:16,709 --> 00:01:19,489
O si lideran, yo que sé, una multinacional

29
00:01:19,489 --> 00:01:21,689
con reglas de datos súper estrictas.

30
00:01:21,849 --> 00:01:22,430
Eso es.

31
00:01:22,590 --> 00:01:24,370
Y a ver, para entender bien la magnitud

32
00:01:24,370 --> 00:01:26,810
de esto, imaginemos el escenario habitual de desarrollo

33
00:01:26,810 --> 00:01:27,530
hasta cenada.

34
00:01:28,049 --> 00:01:29,810
Alguien tiene una idea brutal para una app,

35
00:01:29,950 --> 00:01:32,030
reúne a su equipo y se conectan, pues

36
00:01:32,030 --> 00:01:33,450
digamos, a un modelo de OpenAI.

37
00:01:33,629 --> 00:01:34,909
Claro, el camino clásico.

38
00:01:35,049 --> 00:01:35,609
Sí, sí.

39
00:01:35,650 --> 00:01:37,370
Pero luego llega el problema masivo.

40
00:01:37,510 --> 00:01:39,689
Cada dos semanas el ecosistema cambia.

41
00:01:39,730 --> 00:01:42,109
De repente Anthropic lanza un cloud nuevo que

42
00:01:42,109 --> 00:01:44,650
es objetivamente mucho mejor para esa app.

43
00:01:44,829 --> 00:01:45,969
Y claro, ¿eso qué implica?

44
00:01:46,709 --> 00:01:49,450
Pues implica abrir otra cuenta corporativa, meter otra

45
00:01:49,450 --> 00:01:52,629
tarjeta de crédito, generar claves nuevas y, lo

46
00:01:52,629 --> 00:01:55,250
peor de todo, reescribir un montón de código.

47
00:01:55,530 --> 00:01:56,530
Un cristo, vamos.

48
00:01:56,750 --> 00:01:57,930
Un cristo importante.

49
00:01:58,329 --> 00:02:00,069
Porque la forma en la que OpenAI recibe

50
00:02:00,069 --> 00:02:01,930
los datos no tiene nada que ver con

51
00:02:01,930 --> 00:02:04,230
cómo lo recibe Google con Gemini o Anthropic.

52
00:02:04,489 --> 00:02:07,409
Unos usan JSON estructurado, otros separan el System

53
00:02:07,409 --> 00:02:07,950
Prompt.

54
00:02:08,069 --> 00:02:08,789
¿Pereza técnica?

55
00:02:09,150 --> 00:02:11,569
¿La gente se quedaba anclada a un solo

56
00:02:11,569 --> 00:02:12,050
proveedor?

57
00:02:12,409 --> 00:02:12,969
Totalmente.

58
00:02:13,069 --> 00:02:15,750
¿Te pardías los avances del mercado porque daba

59
00:02:15,750 --> 00:02:16,330
mucha pereza?

60
00:02:17,349 --> 00:02:18,210
Sí, sí, un clásico.

61
00:02:18,210 --> 00:02:20,789
Y justo aquí es donde entran a resolver

62
00:02:20,789 --> 00:02:23,949
el caos plataformas como OpenRouter y Requesty.

63
00:02:24,449 --> 00:02:27,569
Actúan como una capa de abstracción, ofreciendo una

64
00:02:27,569 --> 00:02:28,909
interroquerabilidad brutal.

65
00:02:29,250 --> 00:02:32,110
Quien programa hace una sola integración y ¡boom!,

66
00:02:32,110 --> 00:02:33,550
acceso a cientos de modelos.

67
00:02:33,669 --> 00:02:35,270
A ver, vamos a desgranar esto.

68
00:02:35,430 --> 00:02:37,650
Porque es casi como tener 20 mandos a

69
00:02:37,650 --> 00:02:39,969
distancia distintos en la mesa del salón.

70
00:02:40,069 --> 00:02:41,810
Que si el de la tele, el del

71
00:02:41,810 --> 00:02:44,930
aire acondicionado, el del decodificador… Sí, sí, un

72
00:02:44,930 --> 00:02:45,389
clásico.

73
00:02:45,569 --> 00:02:46,990
Y de repente, pues te contamos… Compras un

74
00:02:46,990 --> 00:02:47,969
mando universal, ¿no?

75
00:02:48,030 --> 00:02:51,389
Pero, según los apuntes de Toby Tiches, no

76
00:02:51,389 --> 00:02:53,349
es solo que este mando envíe la señal.

77
00:02:53,370 --> 00:02:56,330
Es que actúa como un traductor simultáneo en

78
00:02:56,330 --> 00:02:56,930
tiempo real.

79
00:02:57,129 --> 00:02:57,729
Exacto.

80
00:02:57,729 --> 00:03:01,370
Y lo fascinante aquí es precisamente ese matiz

81
00:03:01,370 --> 00:03:02,129
de la traducción.

82
00:03:02,229 --> 00:03:05,229
O sea, no es un simple redireccionamiento de

83
00:03:05,229 --> 00:03:07,710
tráfico, sino que hay un procesamiento de la

84
00:03:07,710 --> 00:03:08,289
sintaxis.

85
00:03:08,550 --> 00:03:11,229
Si la aplicación envía una instrucción de temperatura

86
00:03:11,229 --> 00:03:14,830
para controlar la creatividad, el conector la traduce

87
00:03:14,830 --> 00:03:18,550
para que Gemini o Yamatress… la entiendan perfectamente.

88
00:03:18,750 --> 00:03:19,909
Es que es una pasada.

89
00:03:20,370 --> 00:03:22,689
Elimina por completo la necesidad de leerse la

90
00:03:22,689 --> 00:03:25,650
documentación de cada maldita IA nueva que sale

91
00:03:25,650 --> 00:03:26,069
al mercado.

92
00:03:26,370 --> 00:03:26,830
Tal cual.

93
00:03:26,969 --> 00:03:29,569
Y claro, una vez entendido que ambas plataformas

94
00:03:29,569 --> 00:03:33,069
son este traductor mágico, la pregunta es obligada.

95
00:03:33,389 --> 00:03:34,870
¿En qué se diferencian?

96
00:03:35,050 --> 00:03:36,629
Pues sí, porque si las dos hacen de

97
00:03:36,629 --> 00:03:39,030
puente, a priori daría igual cuál elegir, ¿verdad?

98
00:03:39,189 --> 00:03:41,490
Claro, pero sabemos que no es así ni

99
00:03:41,490 --> 00:03:42,090
de lejos.

100
00:03:42,229 --> 00:03:42,909
Ni de lejos.

101
00:03:43,229 --> 00:03:45,210
Así que vamos a sumergirnos en la primera

102
00:03:45,210 --> 00:03:46,689
contendiente de esta batalla.

103
00:03:46,710 --> 00:03:48,389
Que es Open Router.

104
00:03:48,750 --> 00:03:50,930
Por lo que cuenta el análisis, su filosofía

105
00:03:50,930 --> 00:03:51,710
es cristalina.

106
00:03:51,770 --> 00:03:53,930
Es el modelo Buffet Libre.

107
00:03:53,990 --> 00:03:57,169
Sí, un Buffet Libre con un minimalismo extremo.

108
00:03:57,370 --> 00:03:59,990
O sea, estamos hablando de acceso masivo a

109
00:03:59,990 --> 00:04:02,710
más de 400 modelos de IA diferentes.

110
00:04:03,250 --> 00:04:05,129
400 se dice pronto, ¿eh?

111
00:04:05,250 --> 00:04:06,289
Es una barbaridad.

112
00:04:06,590 --> 00:04:10,330
Cubren desde los gigantes comerciales hasta modelos experimentales

113
00:04:10,330 --> 00:04:11,150
en Hugging Face.

114
00:04:11,430 --> 00:04:14,210
Pero fíjate que su verdadera identidad no es

115
00:04:14,210 --> 00:04:16,769
solo el volumen, sino que han eliminado cualquier

116
00:04:16,769 --> 00:04:17,930
fricción de entrada.

117
00:04:18,290 --> 00:04:20,509
Ya, o sea que te registras y listo.

118
00:04:20,670 --> 00:04:21,149
Exacto.

119
00:04:21,149 --> 00:04:24,209
Te registras, generas tu clave API y en

120
00:04:24,209 --> 00:04:25,949
dos minutos estás mandando peticiones.

121
00:04:26,170 --> 00:04:28,670
Cero burocracia, cero configuraciones raras.

122
00:04:28,910 --> 00:04:30,689
Oye, y hay un detalle en la estructura

123
00:04:30,689 --> 00:04:32,649
de costes que me ha llamado muchísimo la

124
00:04:32,649 --> 00:04:32,870
atención.

125
00:04:33,149 --> 00:04:35,529
Porque rompe un poco con lo que solemos

126
00:04:35,529 --> 00:04:36,589
ver en el software, ¿no?

127
00:04:37,129 --> 00:04:39,290
Sí, lo del markup transaccional.

128
00:04:39,589 --> 00:04:40,129
Eso es.

129
00:04:40,170 --> 00:04:42,750
Te cobran una comisión del 5 ,5%.

130
00:04:42,750 --> 00:04:45,069
Pero solo al recargar el saldo con la

131
00:04:45,069 --> 00:04:45,550
tarjeta.

132
00:04:45,930 --> 00:04:47,750
Luego, cuando ya tienes el dinero en la

133
00:04:47,750 --> 00:04:50,310
cuenta, el coste por token, o sea, cada

134
00:04:50,310 --> 00:04:53,430
palabra generada, es exactamente el mismo que si

135
00:04:53,430 --> 00:04:54,730
fueras directo al proveedor.

136
00:04:54,970 --> 00:04:55,410
Claro.

137
00:04:55,629 --> 00:04:58,850
Te pasan la factura limpia, sin márgenes ocultos

138
00:04:58,850 --> 00:04:59,850
por el uso continuo.

139
00:05:00,009 --> 00:05:02,449
Y eso refleja al 100 % su mentalidad.

140
00:05:02,730 --> 00:05:04,730
No quieren ser tu socio estratégico.

141
00:05:04,769 --> 00:05:07,490
Quieren ser una tubería, súper rápida y sin

142
00:05:07,490 --> 00:05:08,009
estorbos.

143
00:05:08,170 --> 00:05:09,269
Una tubería directa, sí.

144
00:05:09,449 --> 00:05:12,170
Y por eso gustan tanto a desarrolladores independientes,

145
00:05:12,750 --> 00:05:12,930
startups.

146
00:05:13,269 --> 00:05:16,170
Cuando tu objetivo es iterar rápido o probar

147
00:05:16,170 --> 00:05:18,110
20 modelos en una tarde para ver cuál

148
00:05:18,110 --> 00:05:20,870
funciona, no quieres capas de software molestando en

149
00:05:20,870 --> 00:05:21,069
medio.

150
00:05:21,250 --> 00:05:21,449
Claro.

151
00:05:21,550 --> 00:05:24,209
Pero, a ver, entonces, ¿qué significa todo esto?

152
00:05:24,490 --> 00:05:27,110
Si es tan simple y transparente, ¿no corremos

153
00:05:27,110 --> 00:05:28,930
el riesgo de ir a pelo y sin

154
00:05:28,930 --> 00:05:30,689
red de seguridad si el proyecto crece?

155
00:05:31,350 --> 00:05:33,850
Bueno, es que ese es exactamente el punto.

156
00:05:34,029 --> 00:05:35,829
Porque imagínate que la app se hace viral

157
00:05:35,829 --> 00:05:38,209
de golpe, o que un banco decide usarla.

158
00:05:38,529 --> 00:05:41,310
Si van directos, ¿qué pasa con los límites

159
00:05:41,310 --> 00:05:42,730
de uso o la privacidad?

160
00:05:42,750 --> 00:05:46,389
Pues pasa que esa falta de red de

161
00:05:46,389 --> 00:05:49,029
seguridad es una característica de diseño de open

162
00:05:49,029 --> 00:05:50,350
router, no un fallo.

163
00:05:50,410 --> 00:05:53,829
O sea, la responsabilidad recae íntegramente en quien

164
00:05:53,829 --> 00:05:54,350
desarrolla.

165
00:05:54,670 --> 00:05:55,310
Ostras, claro.

166
00:05:55,470 --> 00:05:56,629
Te lo tienes que montar tú.

167
00:05:57,110 --> 00:05:57,649
Exacto.

168
00:05:57,649 --> 00:06:00,889
Si necesitas limitar peticiones para no arruinarte o

169
00:06:00,889 --> 00:06:03,769
filtrar contraseñas, tu equipo tiene que programar todo

170
00:06:03,769 --> 00:06:05,649
eso desde cero en sus propios servidores.

171
00:06:05,949 --> 00:06:08,009
Ya, y claro, aquí es donde la cosa

172
00:06:08,009 --> 00:06:09,290
se pone muy interesante.

173
00:06:09,629 --> 00:06:12,089
Porque a medida que un proyecto escala, la

174
00:06:12,089 --> 00:06:12,730
velocidad de la red de seguridad se desvanece.

175
00:06:12,750 --> 00:06:13,189
La red de seguridad pura ya no es

176
00:06:13,189 --> 00:06:14,029
lo único que importa.

177
00:06:14,529 --> 00:06:17,269
Entran los de legal, los de finanzas… Y

178
00:06:17,269 --> 00:06:19,209
te cambian la conversación entera, claro.

179
00:06:19,410 --> 00:06:20,129
Por completo.

180
00:06:20,589 --> 00:06:23,069
Ya no se habla de probar modelos, sino

181
00:06:23,069 --> 00:06:24,269
de mitigar riesgos.

182
00:06:24,569 --> 00:06:26,730
Y esto nos lleva de lleno al enfoque

183
00:06:26,730 --> 00:06:28,550
radicalmente opuesto de Requesty.

184
00:06:28,769 --> 00:06:31,329
O sea, si open router es un coche

185
00:06:31,329 --> 00:06:34,649
de carrera súper ligero, Requesty sería como contratar

186
00:06:34,649 --> 00:06:36,930
a un asesor financiero y un guardaespaldas a

187
00:06:36,930 --> 00:06:37,170
la vez.

188
00:06:37,490 --> 00:06:38,310
Sí, sí.

189
00:06:38,370 --> 00:06:41,370
Si conectamos esto con el panorama general, la

190
00:06:41,370 --> 00:06:43,850
comparación del blindaje… Es buenísima.

191
00:06:44,329 --> 00:06:47,569
Requesty sacrifica un poco esa ligereza para añadir

192
00:06:47,569 --> 00:06:49,550
características de grado empresarial.

193
00:06:49,970 --> 00:06:51,110
Puras y duras.

194
00:06:51,370 --> 00:06:53,610
Que a nivel de catálogo tampoco andan cojos,

195
00:06:53,670 --> 00:06:53,850
¿eh?

196
00:06:53,870 --> 00:06:55,410
Que tienen más de 300 modelos.

197
00:06:55,629 --> 00:06:56,230
Cierto.

198
00:06:56,290 --> 00:06:57,509
Es una oferta inmensa.

199
00:06:57,649 --> 00:07:00,589
Pero su obsesión es el control del flujo

200
00:07:00,589 --> 00:07:00,910
de datos.

201
00:07:01,290 --> 00:07:04,449
De hecho, el material de Tobitiches destaca muchísimo

202
00:07:04,449 --> 00:07:06,470
sus guardias de seguridad integrados.

203
00:07:06,689 --> 00:07:08,370
Y esto me flipa arquitectónicamente.

204
00:07:08,930 --> 00:07:10,730
Dicen que son filtros activos.

205
00:07:10,889 --> 00:07:12,970
A ver, imagínate una app de atención, y

206
00:07:12,970 --> 00:07:16,209
un usuario despistado pone Hola, mi tarjeta es

207
00:07:16,209 --> 00:07:17,029
esta, cobradme.

208
00:07:17,149 --> 00:07:20,110
Un clásico que da terror a cualquier empresa.

209
00:07:20,589 --> 00:07:23,110
Claro, porque si vas con conexión directa, ese

210
00:07:23,110 --> 00:07:26,290
número de tarjeta viaja por Internet, entra en

211
00:07:26,290 --> 00:07:28,389
un servidor de terceros y se queda en

212
00:07:28,389 --> 00:07:28,829
sus logs.

213
00:07:29,069 --> 00:07:31,250
Una pesadilla para la protección de datos.

214
00:07:31,730 --> 00:07:34,050
Totalmente ilegal en muchos contextos, además.

215
00:07:34,449 --> 00:07:36,490
Pero Requesty intercepta el mensaje.

216
00:07:36,689 --> 00:07:39,050
La duda que me surge es ¿cómo hacen

217
00:07:39,050 --> 00:07:41,129
esto en tiempo real sin añadir un lag

218
00:07:41,129 --> 00:07:41,810
espantoso?

219
00:07:41,930 --> 00:07:44,569
Porque, si la IA tarda 10 segundos por

220
00:07:44,569 --> 00:07:46,790
culpa del filtro, el usuario se marcha.

221
00:07:46,910 --> 00:07:49,290
Bueno, la clave está en el Let's Computing

222
00:07:49,290 --> 00:07:52,550
y en expresiones regulares muy, muy optimizadas.

223
00:07:52,810 --> 00:07:54,689
O sea, no mandan el texto a otra

224
00:07:54,689 --> 00:07:56,750
IA gigantesca para que lo lea, sino que

225
00:07:56,750 --> 00:08:00,110
usan patrones de reconocimiento ultra rápidos para cazar

226
00:08:00,110 --> 00:08:01,009
cosas sensibles.

227
00:08:01,370 --> 00:08:01,850
Ah, vale.

228
00:08:02,009 --> 00:08:04,230
O sea, buscan la forma de una tarjeta,

229
00:08:04,230 --> 00:08:06,250
un email, ese tipo de patrones.

230
00:08:06,449 --> 00:08:06,990
Exacto.

231
00:08:06,990 --> 00:08:10,750
Al detectar esa información personal identificable, la bloqueen

232
00:08:10,750 --> 00:08:12,449
o la enmascaran en milisegundos.

233
00:08:12,750 --> 00:08:16,129
Para empresas sujetas al RGPD en Europa, esto

234
00:08:16,129 --> 00:08:17,829
te ahorra meses de auditorías.

235
00:08:17,990 --> 00:08:19,870
Ya lo tienes en la infraestructura.

236
00:08:20,110 --> 00:08:21,509
Madre mía, es que eso vale oro.

237
00:08:21,930 --> 00:08:24,790
Y luego está la seguridad operativa, lo de

238
00:08:24,790 --> 00:08:27,410
los failovers o copias de seguridad automáticas.

239
00:08:27,670 --> 00:08:29,230
Uy, sí, eso es vital en producción.

240
00:08:29,829 --> 00:08:30,850
A ver si lo he entendido bien.

241
00:08:31,189 --> 00:08:32,549
Estás usando GPT -4.

242
00:08:33,169 --> 00:08:34,830
OpenAI se cae a nivel mundial.

243
00:08:34,870 --> 00:08:35,230
¿Qué pasa?

244
00:08:35,429 --> 00:08:37,929
Y Requesty detecta el error 500 y te

245
00:08:37,929 --> 00:08:40,470
manda la petición a Cloud automáticamente para que

246
00:08:40,470 --> 00:08:41,389
tu app no muera.

247
00:08:41,529 --> 00:08:42,169
Eso es.

248
00:08:42,169 --> 00:08:43,230
¿Te salva la vida?

249
00:08:43,470 --> 00:08:45,769
Pero espérate, porque aquí veo un problema.

250
00:08:46,009 --> 00:08:49,009
Si pasas de OpenAI a Cloud en milisegundos,

251
00:08:49,169 --> 00:08:51,210
la IA cambia de personalidad, ¿no?

252
00:08:51,309 --> 00:08:53,370
De repente el usuario nota que el tono

253
00:08:53,370 --> 00:08:55,070
es distinto o el formato cambia.

254
00:08:55,090 --> 00:08:55,889
¿No es un riesgo enorme?

255
00:08:56,169 --> 00:08:58,509
Oye, pues es una deducción buenísima.

256
00:08:58,590 --> 00:09:01,230
Y sí, es un riesgo, especialmente si dependes

257
00:09:01,230 --> 00:09:03,169
de salidas JSON super estrictas.

258
00:09:03,409 --> 00:09:05,169
Pero seamos realistas.

259
00:09:05,289 --> 00:09:07,990
En operaciones a gran escala, entregar una respuesta

260
00:09:07,990 --> 00:09:11,529
un poco diferente es infinitamente mejor que sacar

261
00:09:11,529 --> 00:09:12,149
una pantalla de un dispositivo.

262
00:09:12,149 --> 00:09:12,870
Y no es una idea de error durante

263
00:09:12,870 --> 00:09:13,450
dos horas.

264
00:09:13,690 --> 00:09:16,350
Ya, visto así, la pantalla en blanco es

265
00:09:16,350 --> 00:09:17,269
el mayor de los males.

266
00:09:17,509 --> 00:09:17,990
Claro.

267
00:09:18,129 --> 00:09:21,470
Y además, los desarrolladores pueden configurar esos failovers

268
00:09:21,470 --> 00:09:23,429
para saltar a modelos de la misma familia.

269
00:09:23,649 --> 00:09:25,889
Por ejemplo, de un modelo grande a uno

270
00:09:25,889 --> 00:09:28,409
más pequeño del mismo creador para minimizar ese

271
00:09:28,409 --> 00:09:29,610
choque de personalidad.

272
00:09:29,789 --> 00:09:33,090
Te garantizan el uptime del 99 ,9%.

273
00:09:33,090 --> 00:09:34,730
Vale, vale, me convence.

274
00:09:34,830 --> 00:09:38,009
Pero claro, todo esto suena a magia corporativa.

275
00:09:38,169 --> 00:09:39,669
Y la magia hay que pagarla.

276
00:09:39,750 --> 00:09:41,370
Y aquí es donde quiero apretar un poco.

277
00:09:41,509 --> 00:09:41,950
Venga.

278
00:09:42,149 --> 00:09:45,590
Vale, dicen que ahorras un 80%, pero de

279
00:09:45,590 --> 00:09:47,870
entrada te están cobrando un 5 % extra

280
00:09:47,870 --> 00:09:48,730
por cada uso.

281
00:09:48,909 --> 00:09:50,850
O sea, un peaje continuo.

282
00:09:51,129 --> 00:09:53,470
¿Realmente compensa este peaje si no eres una

283
00:09:53,470 --> 00:09:54,289
megacorporación?

284
00:09:54,490 --> 00:09:57,769
Pues mira, esta aparente contradicción es lo mejor

285
00:09:57,769 --> 00:09:58,429
de Requesty.

286
00:09:58,899 --> 00:10:01,750
Y para entenderlo, hay que saber cómo se

287
00:10:01,750 --> 00:10:04,230
quema realmente el dinero en la IA generativa.

288
00:10:04,490 --> 00:10:08,169
Si Requesty fuera solo un tubo pasivo, ese

289
00:10:08,169 --> 00:10:10,409
5 % extra sería una ruina.

290
00:10:10,549 --> 00:10:13,129
Claro, estaría esperando perdiendo dinero a expuertas.

291
00:10:13,450 --> 00:10:17,230
Exacto, pero lo compensan con inteligencia financiera automatizada.

292
00:10:18,250 --> 00:10:19,629
Concretamente, con dos cosas.

293
00:10:20,009 --> 00:10:23,929
El enrutamiento inteligente y el almacenamiento en caché

294
00:10:23,929 --> 00:10:24,450
semántica.

295
00:10:24,769 --> 00:10:25,809
A ver, pausa aquí.

296
00:10:26,210 --> 00:10:27,289
Lo de la caché.

297
00:10:27,649 --> 00:10:29,909
En software normal, si un millón de personas

298
00:10:29,909 --> 00:10:32,690
piden la misma foto, el servidor la guarda

299
00:10:32,690 --> 00:10:34,629
y la enseña sin volver a calcularla, ¿no?

300
00:10:34,769 --> 00:10:35,250
Exacto.

301
00:10:35,269 --> 00:10:36,830
Sí, una caché de libro.

302
00:10:37,149 --> 00:10:40,470
Pero en inteligencia artificial se supone que cada

303
00:10:40,470 --> 00:10:41,389
pregunta es única.

304
00:10:42,149 --> 00:10:44,509
Si yo digo, ¿cómo devuelvo estos zapatos que

305
00:10:44,509 --> 00:10:45,169
me aprietan?

306
00:10:45,230 --> 00:10:47,769
Y otro dice, ¿cuál es la política de

307
00:10:47,769 --> 00:10:48,250
devoluciones?

308
00:10:48,549 --> 00:10:50,830
Las frases son súper distintas.

309
00:10:51,090 --> 00:10:53,889
¿Cómo demonios cacheas algo que no es texto

310
00:10:53,889 --> 00:10:54,509
idéntico?

311
00:10:54,710 --> 00:10:55,110
¡Ostras!

312
00:10:55,370 --> 00:10:56,789
Es que ese es el gran cambio de

313
00:10:56,789 --> 00:10:58,110
paradigma del que estamos hablando.

314
00:10:58,549 --> 00:11:01,169
Pasamos de IA generativa a casi, no sé,

315
00:11:01,269 --> 00:11:02,090
IA reciclada.

316
00:11:02,750 --> 00:11:05,929
Requesty usa una caché semántica, no de texto

317
00:11:05,929 --> 00:11:06,570
exacto.

318
00:11:06,990 --> 00:11:08,750
Vale, ¿y eso cómo se come?

319
00:11:08,990 --> 00:11:11,769
Pues cogen modelos muy pequeños que convierten la

320
00:11:11,769 --> 00:11:13,450
pregunta en vectores matemáticos.

321
00:11:13,870 --> 00:11:15,710
Básicamente extraen la intención.

322
00:11:16,289 --> 00:11:18,450
Si los vectores de los zapatos que aprietan

323
00:11:18,450 --> 00:11:21,230
y la política general de devoluciones son idénticos

324
00:11:21,230 --> 00:11:23,750
en significado, el sistema sabe que la respuesta

325
00:11:23,750 --> 00:11:24,330
es la misma.

326
00:11:24,629 --> 00:11:25,149
¡Ostras!

327
00:11:25,429 --> 00:11:25,590
Claro.

328
00:11:25,730 --> 00:11:27,710
Así que en lugar de despertar al modele

329
00:11:27,710 --> 00:11:30,929
principal, que te cuesta pasta por palabra, requesty

330
00:11:30,929 --> 00:11:32,610
saca la respuesta guardada y te la da

331
00:11:32,610 --> 00:11:33,909
gratis y al instante.

332
00:11:34,029 --> 00:11:34,330
¡Guau!

333
00:11:34,690 --> 00:11:37,289
Visto así, claro, los números cambian por completo.

334
00:11:37,490 --> 00:11:40,009
Si el 40 % de tus usuarios hacen

335
00:11:40,009 --> 00:11:43,370
variaciones de las mismas 5 preguntas, casi la

336
00:11:43,370 --> 00:11:45,309
mitad de tus peticiones te salen a coste

337
00:11:45,309 --> 00:11:45,590
cero.

338
00:11:46,169 --> 00:11:46,730
Literalmente.

339
00:11:46,870 --> 00:11:50,830
Dejas de quemar billetes repitiendo procesos cognitivos que

340
00:11:50,830 --> 00:11:52,889
la IA ya solucionó ayer por la tarde.

341
00:11:53,070 --> 00:11:56,450
El sobrecoste del 5 % se amortiza rapidísimo.

342
00:11:56,809 --> 00:11:57,730
Es alucinante.

343
00:11:57,830 --> 00:12:00,750
Y mencionabas también el enrutamiento inteligente.

344
00:12:00,970 --> 00:12:02,610
Sí, ese es el segundo mecanismo.

345
00:12:02,769 --> 00:12:05,110
Puedes poner reglas de negocio complejas sin tocar

346
00:12:05,110 --> 00:12:05,590
tu código.

347
00:12:05,970 --> 00:12:08,210
Imagina que tienes un presupuesto cerrado para un

348
00:12:08,210 --> 00:12:09,450
modelo superprimium.

349
00:12:09,610 --> 00:12:10,090
Vale.

350
00:12:10,210 --> 00:12:12,590
Si llegas al 90 % del presupuesto, a

351
00:12:12,590 --> 00:12:16,649
mediados de mes, Requesty automáticamente manda las consultas

352
00:12:16,649 --> 00:12:19,289
fáciles a un modelo de código abierto baratísimo

353
00:12:19,289 --> 00:12:22,070
y reserva el premium solo para tareas supercomplejas.

354
00:12:22,990 --> 00:12:23,909
Madre mía, claro.

355
00:12:24,389 --> 00:12:25,730
Es que cambia la perspectiva.

356
00:12:25,830 --> 00:12:26,909
Ya no es un peaje.

357
00:12:26,990 --> 00:12:29,649
Es como tener suprotratado a un departamento entero

358
00:12:29,649 --> 00:12:31,629
de finanzas y seguridad por una miseria.

359
00:12:31,750 --> 00:12:32,129
Tal cual.

360
00:12:32,289 --> 00:12:34,169
¿Te optimizan todos sin que tú tengas que

361
00:12:34,169 --> 00:12:34,590
hacer nada?

362
00:12:34,789 --> 00:12:36,889
Pues creo que con este nivel de detalle

363
00:12:36,889 --> 00:12:38,889
la radiografía está clarísima.

364
00:12:39,070 --> 00:12:42,049
Tenemos los dos conectores diseccionados.

365
00:12:42,070 --> 00:12:44,789
Así que, para quien nos esté escuchando y

366
00:12:44,789 --> 00:12:47,009
mañana tenga que decidir la arquitectura de su

367
00:12:47,009 --> 00:12:50,690
próximo sistema, ¿cómo resumirías el veredicto definitivo?

368
00:12:51,009 --> 00:12:53,210
Pues mira, ciñéndonos al análisis.

369
00:12:53,309 --> 00:12:55,690
Todo se reduce a la tolerancia al riesgo

370
00:12:55,690 --> 00:12:57,230
frente a la necesidad de control.

371
00:12:57,929 --> 00:13:00,649
Si lo que priorizas es la simplicidad radical,

372
00:13:01,389 --> 00:13:04,210
explorar cientos de modelos sin estorbos y construir

373
00:13:04,210 --> 00:13:07,269
rápido, OpenRouter es tu ganador indiscutible.

374
00:13:07,429 --> 00:13:09,450
Es el lienzo en blanco perfecto.

375
00:13:09,529 --> 00:13:11,730
La filosofía del circuito cerrado, no.

376
00:13:12,070 --> 00:13:14,029
Pura velocidad y cero peso extra.

377
00:13:14,409 --> 00:13:14,970
Exacto.

378
00:13:15,269 --> 00:13:18,289
Pero, si el entorno te exige garantías, si

379
00:13:18,289 --> 00:13:20,649
no te puedes permitir caídas de servidores, si

380
00:13:20,649 --> 00:13:23,250
tienes obligación legal de bloquear fuga de datos

381
00:13:23,250 --> 00:13:26,289
y si tu volumen pide automatizar ahorros con

382
00:13:26,289 --> 00:13:29,870
cachers semánticas, entonces requesties la opción imperativa.

383
00:13:30,149 --> 00:13:33,350
Lo ideal, como siempre recomiendan, es hacerse cuentas

384
00:13:33,350 --> 00:13:35,110
de prueba y cacharrear con las dos.

385
00:13:35,269 --> 00:13:37,529
Me parece una conclusión súper práctica.

386
00:13:37,769 --> 00:13:39,350
El que quiera el viento en la cara

387
00:13:39,350 --> 00:13:40,909
probando cosas, tiene una.

388
00:13:40,909 --> 00:13:42,870
Y el que necesite cruzar un campo de

389
00:13:42,870 --> 00:13:45,129
minos corporativos sin gastar de más, tiene la

390
00:13:45,129 --> 00:13:45,309
otra.

391
00:13:45,669 --> 00:13:48,169
El análisis lo deja súper claro.

392
00:13:48,350 --> 00:13:49,590
Pero, ¿sabes?

393
00:13:49,789 --> 00:13:51,710
Esto plantea una pregunta importante.

394
00:13:52,029 --> 00:13:54,570
Una reflexión de fondo para la audiencia.

395
00:13:54,909 --> 00:13:55,730
A ver, dispara.

396
00:13:55,889 --> 00:13:58,389
Hemos visto que cambiar de GPT a Cloud

397
00:13:58,389 --> 00:14:01,730
o Gemini es ahora tan trivial como enchufar

398
00:14:01,730 --> 00:14:02,409
un cable USB.

399
00:14:02,690 --> 00:14:05,830
Y si el acceso es tan intercambiable, nos

400
00:14:05,830 --> 00:14:08,029
estamos acercando al punto en el que el

401
00:14:08,029 --> 00:14:10,230
modelo de IA en sí se vuelve un

402
00:14:10,230 --> 00:14:10,889
producto generalizado.

403
00:14:10,909 --> 00:14:13,389
O sea, una simple commodity.

404
00:14:13,870 --> 00:14:14,789
Qué buena pregunta.

405
00:14:15,289 --> 00:14:17,269
Claro, y si el verdadero valor en el

406
00:14:17,269 --> 00:14:19,649
futuro no es la IA que uses, sino

407
00:14:19,649 --> 00:14:23,230
la infraestructura inteligente, el enrutamiento y la seguridad

408
00:14:23,230 --> 00:14:24,889
que envuelven a esos modelos.

409
00:14:25,090 --> 00:14:27,269
Uf, es un planteamiento que le da la

410
00:14:27,269 --> 00:14:28,250
vuelta a todo a la verdad.

411
00:14:28,649 --> 00:14:31,070
Llevamos años obsesionados con la marca del agua

412
00:14:31,070 --> 00:14:33,429
que sale por el grifo, debatiendo si esta

413
00:14:33,429 --> 00:14:35,409
es mejor que la otra, y resulta que

414
00:14:35,409 --> 00:14:38,330
la verdadera revolución está en las tuberías inteligentes

415
00:14:38,330 --> 00:14:40,409
que deciden por dónde y a qué precio

416
00:14:40,409 --> 00:14:41,350
fluye esa agua.

417
00:14:41,610 --> 00:14:44,090
Menuda idea monumental para dejarla macerando.

418
00:14:44,309 --> 00:14:47,049
Antes de despedirnos hasta el próximo programa, os

419
00:14:47,049 --> 00:14:48,710
informamos de que las voces que oyes han

420
00:14:48,710 --> 00:14:51,250
sido generadas por la IA de Notebook LM

421
00:14:51,250 --> 00:14:53,649
y que dirigiendo el podcast se encuentra Julio

422
00:14:53,649 --> 00:14:55,970
Pablo Vázquez, un humano que te envía saludos.

423
00:14:56,110 --> 00:14:58,950
En caso de error, probablemente sean errores humanos.

424
00:14:59,289 --> 00:15:00,230
Nos escuchamos.

425
00:15:11,179 --> 00:15:13,399
Y hasta aquí el episodio de hoy.

426
00:15:13,519 --> 00:15:15,259
Muchas gracias por tu atención.

427
00:15:24,840 --> 00:15:26,740
Esto es BIM Praxis.

428
00:15:27,019 --> 00:15:28,120
Nos escuchamos.

429
00:15:28,399 --> 00:15:29,539
En el próximo episodio.

