Si buscas la mejor computadora portátil para trabajar en ciencia y análisis de datos, debes tener en cuenta una serie de requisitos imprescindibles para que las aplicaciones de ciencias de datos funcionen en forma óptima. Más abajo veremos las especificaciones ideales de las mejores notebooks para ciencia de datos. Pero primero, algunos conocimientos básicos sobre este tema.
La ciencia de los datos es un campo de estudio en el que se analizan grandes volúmenes de datos utilizando herramientas y técnicas modernas para encontrar patrones no evidentes, con el objetivo de obtener información significativa que facilite la toma de decisiones. Entre otras cosas, la ciencia de los datos utiliza complejos algoritmos de aprendizaje automático para construir modelos predictivos. Los datos utilizados para el análisis pueden proceder de múltiples fuentes y presentarse en diversos formatos.
Quienes trabajan en ciencias de datos se denominan científicos de datos o data scientists. El trabajo de los científicos de datos consiste básicamente en utilizar herramientas informáticas de avanzada para buscar insights o revelaciones ocultas en grandes cantidades de información y transmitirlas en forma efectiva para que resulten útiles.
El aprendizaje automático (Machine Learning) es un método de análisis de datos que automatiza la construcción de modelos analíticos. Es una rama de la inteligencia artificial basada en la idea de que los sistemas pueden aprender de los datos, identificar patrones y tomar decisiones con una mínima intervención humana.
El aprendizaje automático ha cambiado el funcionamiento de la extracción e interpretación de datos al implicar conjuntos automáticos de métodos genéricos que han sustituido a las técnicas estadísticas tradicionales.
El análisis de datos se ha caracterizado tradicionalmente por el enfoque de prueba y error, que resulta imposible de utilizar cuando se trabaja con grandes y heterogéneos volúmenes de datos. La disponibilidad de mayores cantidades de datos es directamente proporcional a la dificultad de aportar nuevos modelos predictivos que funcionen con precisión. Las soluciones estadísticas tradicionales se centran más en el análisis estático que se limita al análisis de muestras congeladas en el tiempo, derivando en conclusiones poco fiables e inexactas.
Como solución a todo este caos llega el Machine Learning (o ML), que propone alternativas inteligentes para analizar grandes volúmenes de datos. El aprendizaje automático puede producir resultados y análisis precisos mediante el desarrollo de algoritmos eficientes y rápidos y modelos basados en datos para el procesamiento en tiempo real de estos datos.
Las computadoras para aprendizaje automático deben poder ejecutar cómodamente aplicaciones como Tensorflow, Knime, Neural Designer, Keras, MXNet, Theano y RapidMiner, entre otras. Para ello requieren CPUs veloces y con múltiples núcleos que permitan correr procesos en paralelo (más sobre CPUs abajo).
Otra rama de la inteligencia artificial relacionada con Machine Learning es el aprendizaje profundo (Deep Learning o DL). Mientras que el ML es un proceso que pone más presión a la CPU, Deep Learning requiere una potente GPU que incluya un gran número de núcleos para procesamiento paralelo. Para trabajar con redes neuronales y otros procesos de inteligencia artificial necesitas considerar también una buena cantidad de memoria RAM. Y si utilizarás almacenamiento local para los datos a analizar en lugar de almacenamiento en la nube, la notebook debe incluir un veloz disco de estado sólido con gran capacidad.
Toda computadora para análisis de datos en 2021 debe reunir las siguientes características:
No ahorres en memoria, ve por toda la que tu presupuesto te permita conseguir. Si cuentas con una buena cantidad de RAM, podrás hacer uso de bases de datos en memoria (in-memory databases) y tendrás la posibilidad de correr scripts Python y R que manejen grandes estructuras de datos en memoria, así como trabajar con los más potentes IDEs para Python.
Para definir una cifra, vale decir que la memoria de 8 GB de RAM hace tiempo que dejó de ser una especificación recomendada. Para trabajar en ciencia de datos es necesario contar con 16 GB de RAM como mínimo. 32 GB puede ser realmente útil si está dentro de tu presupuesto y si esperas que tu máquina siga siendo útil dentro de 3 años. Si tu presupuesto no alcanza para 32 GB de RAM ahora mismo, al menos asegúrate de que tu portátil te permita ampliarle la memoria en el corto plazo.
El almacenamiento en la nube, al igual que las bases de datos hospedadas en servidores de nube, son la mejor opción para trabajar con repositorios de Big Data que difícilmente quepan en el disco de una laptop. Pero si tu conexión a Internet no es del todo confiable, o si la velocidad de acceso a datos almacenados es un aspecto crítico en tus tareas como científico de datos, entonces el disco duro será un factor de peso al momento de elegir entre las mejores portátiles para ciencia de datos.
De todos modos, aunque no almacenes tus datos en el disco de tu portátil, debes apuntar a un disco de estado sólido veloz – un SSD PCIe u otra forma de almacenamiento flash, como una unidad M.2 – de 512 GB como mínimo. Esto te dará espacio suficiente para el sistema operativo, tus ambientes de trabajo, algún servidor local de bases de datos y algunas máquinas virtuales. Si tu presupuesto lo permite, ve por un disco de 1 TB, que también te dará espacio para almacenar localmente algunas bases de datos y repositorios de tamaño moderado.
Es muy probable que en un par de años necesites el doble de almacenamiento del que requieres hoy. Ten en cuenta esto en función del plazo que esperas que dure tu disco duro antes de volverse obsoleto. También está la posibilidad de ampliar tu capacidad de almacenamiento con unidades externas, pero esta opción no es la más recomendable, ya que la velocidad de acceso al disco se ve limitada por la velocidad de la interfaz USB.
A diferencia de las especificaciones de memoria y disco, en donde más es simplemente mejor, la elección de una marca y un modelo de microprocesador para ciencias de datos es realmente difícil, ya que depende del tipo de trabajo que planees hacer. No hay un único modelo que sea el mejor para todo, y es difícil encontrar comparaciones públicas o sitios web donde se informe con exactitud el rendimiento de cada procesador con cada herramienta de análisis, cada algoritmo o cada librería.
Desde tiempos inmemoriales, Intel y AMD se disputan el liderazgo en performance y en precio, pero recientemente los chips de arquitectura ARM de 9a generación (principalmente los de Qualcomm) aparecieron con propuestas de paralelismo intensivo y bajo consumo, lo cual en algunas situaciones logra inclinar la balanza a su favor. Todas estas empresas nos llenan con mensajes de marketing que no hacen otra cosa más que aumentar nuestra confusión a la hora de elegir una portátil en base al rendimiento de su CPU para ciencia de datos.
Según las últimas noticias, parecería que AMD tiene las CPUs más potentes. La pregunta es: ¿más potentes para qué? Los modelos de CPUs Ryzen más recientes muestran impresionantes índices de rendimiento en juegos 3D, pero los algoritmos de ciencias de datos hacen un uso muy diferente de los recursos del procesador del que hacen los juegos.
Hay, sin embargo, algunos datos que no salen en las noticias, pero que son importantes para los científicos de datos. Como por ejemplo que Intel está aplicando su experiencia en matemática de supercomputadoras para potenciar sus chips para computadoras personales. Estas son algunas perlas que inclinan la balanza a favor de Intel, tomadas de la publicación Cómo elegir una CPU para ciencia de datos:
Aunque AMD lidere en comparaciones de performance generales, las CPUs de Intel – particularmente la 9a generación de chips i5, i7 e i9 – siguen ofreciendo muy alta performance, y en la mayoría de las herramientas para ciencia de datos, mayor rendimiento que su competencia.
Hubo una época en que la unidad de procesamiento gráfico, o GPU, era sólo para jugar. Hoy las GPU se utilizan para cualquier cosa que requiera procesamiento paralelo intensivo, como la criptominería y diversas ramas de la inteligencia artificial, como aplicaciones de redes neuronales y entrenamiento de modelos de Deep Learning.
Entonces, ¿qué modelo de GPU es preferible que tenga una portátil para ciencia de datos? La respuesta es parecida a la que dimos antes para la CPU, pero cambiando a Intel por Nvidia. Esto quiere decir que, aunque AMD con sus GPUs Radeon esté actualmente ofreciendo un rendimiento insuperable en GPUs para juegos, cuando se habla de ciencia de datos, Nvidia tiene un gran punto a su favor llamado CUDA.
CUDA es una tecnología surgida hace más de 10 años con el objetivo de llevar el procesamiento de propósito general a las GPUs (algo llamado GPGPU). En la vereda de enfrente está OpenCL, una especificación abierta adoptada por los competidores de Nvidia (principalmente AMD). CUDA simplmente disfruta de la ventaja de haber empezado antes, por lo que las principales herramientas de IA están optimizadas para CUDA.
Pero Nvidia tiene otro as bajo la manga: los denominados núcleos Tensor (o Tensor Cores). Los Tensor Cores hacen posible el cómputo de precisión mixta, adaptando dinámicamente los cálculos para acelerar el rendimiento sin perder precisión. La última generación amplía estas funcionalidad a una amplia gama de cargas de trabajo. ¿Los resultados? Aumentar hasta 10 veces la velocidad en entrenamiento de modelos con Tensor Float 32 (TF32) o aumentar hasta 2,5 veces la aritmética de punto flotante de 64 bits (FP64).
Por todo lo dicho anteriormente, nuestra selección de opciones de portátiles para ciencia de datos se limita a modelos con CPU Intel y GPU Nvidia.
En términos generales, cualquier ordenador portátil que reúna las características técnicas explicadas arriba cumple las condiciones necesarias para convertirse en una herramienta para un científico de datos. Lo que inclinará la balanza hacia un modelo en particular son otras características, como por ejemplo la calidad de la pantalla, la duración de la batería o la comodidad del teclado.
A continuación analizamos los 7 modelos de computadoras portátiles más destacados por sus virtudes para trabajar en el análisis de grandes conjuntos de datos. Aclaro que los vínculos a las páginas de cada máquina son patrocinados, lo que significa que recibo comisiones por las ventas que pudieran hacerse siguiendo esos vínculos. Si compran alguna de estas computadoras, les agradezco mucho por las comisiones que esas compras me pudieran generar.
La Dell XPS 15 ofrece una amplia gama de opciones de configuración y de precios. En su versión más económica, incluye una CPU Intel Core i5, 8 GB de memoria y un SSD de 256 GB. Pero para hacer ciencia de datos, no nos sirven las versiones más económicas, por lo que para la Dell XPS 15 consideraremos un modelo más avanzado (y más costoso): CPU Intel Core i7-10875H, 16 GB de RAM DDR4, GPU Nvidia GeForce GTX 1650 TI, pantalla táctil de 15,6 pulgadas Ultra-HD+ y SSD de 512 GB. Para quienes puedan pagar un poco más, la capacidad de almacenamiento SSD se puede ampliar hasta 2 TB.
Hay varios aspectos que destacan a la Dell XPS 15 por sobre su competencia. Comenzando por su CPU de décima generación. Y siguiendo por la relación de aspecto 16:10 y la impresionante resolución de 3840 x 2400 de su pantalla, ideal para amplias visualizaciones de datos que no requieren hacer zoom para observar los detalles.
La batería de esta máquina tiene una duración de 6 horas, lo cual no es poco para un equipo dotado de un Intel Core de la serie H, una GPU discreta y una pantalla de resolución ultra alta.
El equilibrio entre la velocidad de GPU y de CPU de la Dell XPS9560 la convierte en una opción ideal para programación y ejecución de algoritmos. A esto se suma una duración promedio de la batería estimada en 12 horas, lo que le permite ejecutar extensos trabajos de análisis de datos sin siquiera enchufarla a la corriente eléctrica.
Esta portátil de Dell presenta una construcción sólida, con máxima durabilidad y mínimo tamaño, gracias a su chasis de aluminio de diseño ultra delgado. A esto se suma una amplia y atractiva pantalla táctil de 15,6 pulgadas InfiniEdge de máxima resolución. A pesar de estas bondades, algunos usuarios de la Dell XPS9560 se quejan de que su batería murió en cuestión de unos pocos meses, y que su motherboard es demasiado delicado, lo que obliga a costosas reparaciones o a un reemplazo en un período corto.
Esta notebook presenta un diseño elegante y moderno, con sobresalientes características térmicas. La Aus VivoBook se anuncia como una notebook de gaming, pero sus especificaciones la hacen una potente máquina para ciencias de datos. Ofrece un tamaño reducido y gran portabilidad, sin restar potencia, gracias a su CPU Intel de 7ª generación con 4 núcleos.
El doble ventilador de la VivoBook, junto con las tomas de aire adicionales en el diseño inferior, evitan que la máquina levante temperatura cuando procesa a toda potencia. Los ventiladores no producen ningún ruido, lo que nos permite concentrarnos en detectar insights en la información que analizamos. Uno de los aspectos más atractivos de esta portátil Asus es que sus componentes internos (inclusive su pantalla) pueden actualizarse sin necesidad de recurrir a un centro de servicio especializado.
El único defecto que mencionan los usuarios acerca de la Asus VivoBook es que su pantalla antirreflejos, si bien es reconfortante para la vista, no resulta muy durable. Muchos compradores de este equipo reportaron parpadeos o apagones repentinos de la pantalla luego de algunos meses de uso. Otro aspecto del que se quejan los usuarios es la poca confiabilidad de las bisagras.
A diferencia de los dos modelos anteriores basados en CPU Intel i7, la Dell Inspiron 15 i5577 cuenta con un micro Intel Core i5-7300HQ de cuatro núcleos, el cual ofrece una performance inferior en alrededor de un 30% al i7 en pruebas sintéticas. Esto no quiere decir que esta máquina ofrezca un 30% menos de rendimiento que las anteriores, ya que en muchas cargas de trabajo de ciencia de datos tiene más peso la memoria, el almacenamiento o la GPU. Por esta razón, la diferencia de CPU puede ser poco relevante en muchas situaciones, y al entrar en juego el precio, esta máquina con i5 puede resultar más atractiva.
En materia de GPU, la Dell Inspiron 15 i5577 no tiene nada que envidiarles a los otros modelos, ya que cuenta con la misma placa gráfica dedicada Nvidia GeForce GTX 1050 con 4 GB de memoria de video. Sin embargo, en cuanto a memoria RAM, ofrece sólo 8 GB ampliables hasta 32 GB. Y su almacenamiento interno es un SSD ciertamente pequeño, de 256 GB. Para quienes buscan una máquina multipropósito, este modelo ofrece alta calidad de audio con Wave MaxxAudio, y una pantalla LED FHD antirreflejo de 15,6 pulgadas y resolución máxima de 1920 x 1080.
Está claro que no se trata del modelo mejor equipado, pero igualmente es apto para muchas de las tareas de ciencias de datos, y su precio es más adecuado para presupuestos ajustados.
La CPU de la Lenovo Ideapad Y700 17 es un procesador Intel Core i7-6700HG de 6a generación. La diferencia con los procesadores de 7a generación de los otros modelos es escasa, ya que ambas generaciones utilizan la misma arquitectura de microprocesador. El chip de 6a generación de la Ideapad Y700 corre a una frecuencia ligeramente inferior a la de sus pares de 7a generación, pero en la práctica esa diferencia sólo puede notarse en procesos de cálculo intensivo.
En materia de GPU, esta notebook incluye una Nvidia GeForce GTX 960M con 4 GB de memoria de video. Hay una diferencia importante en cuanto rendimiento con respecto a las GTX 1050, pero, al igual que lo que ocurre con el microprocesador, la diferencia sólo se vuelve evidente en tareas que hagan un uso intensivo del procesamiento paralelo de la GPU. Y al utilizar CPU y GPU de generaciones anteriores, su precio resulta más accesible.
El resto de las especificaciones dan cuenta de una memora RAM DDR4 de 16 GB y un disco pequeño de estado sólido de 128 GB para sistema operativo y aplicaciones más un disco HDD de 1 TB para datos (también se ofrece sin HDD y con un SDD de mayor tamaño). Un aspecto destacable de esta máquina es su gran pantalla de 17,3 pulgadas con resolución de 1920 x 1080, que hace al equipo algo más voluminoso y ligeramente más pesado, pero le aporta una capacidad superior de visualización.
Esta máquina no tiene lo último en CPU y GPU, pero está muy bien dotada en cuanto a memoria, almacenamiento y – sobre todo – pantalla. La duración de su batería se estima en 4,5 horas, pero este tiempo puede reducirse bajo un régimen de uso intensivo. Aún así, dado su precio, la máquina es adecuada para presupuestos ajustados.
La Acer Aspire R15 es una máquina para científicos de datos que aprecian las ventajas de trabajar con estilo. Si bien este modelo no es de los más nuevos, los usuarios lo siguen recomendando por su destacable experiencia de uso.
Los equipos 2-en-1 (o convertibles de 360 grados) suelen presentar problemas con las bisagras. Pero con la Aspire R15 2-en-1, Acer logró que la pantalla se mantuviera muy estable en cualquier posición. Así y todo, el equipo es notablemente liviano, y su trackpad se destaca por su suavidad y precisión.
Para trabajar en visualización de datos, la pantalla LED panorámica multitáctil brinda una sorprendente experiencia de uso. El paquete se completa con un teclado sumamente cómodo, una excelente calidad de sonido y una batería de 9 horas de duración.
Dado que tiene algunos años de antigüedad, los componentes internos de la Acer Aspire R15 no están precisamente a la altura de sus loables características externas. Si bien la CPU es Intel Core i7 de séptima generación, la memoria RAM es de sólo 12 GB, y la GPU es una Nvidia GeForce 940MX con 2 GB de memoria, cuyo rendimiento es bastante inferior al de la GTX 1050 incluida en otros modelos de notebooks.
Esta computadora es un caso especial, ya que no cuenta con CPU Intel sino con un chip M1 propio de Apple. Merece un lugar destacado en esta revisión por su impresionante performance, y por el hecho de mantener intactas las virtudes a las que los usuarios de equipos MacBook están acostumbrados, como una operación silenciosa, un peso mínimo y una muy extensa duración de la batería: nada menos que 14 horas.
El único inconveniente de utilizar una máquina con CPU M1 para ciencia de datos es que algunas librerías importantes para ciencias de datos, como Pandas y Scikit-Learn, no corren aún en forma nativa en esta plataforma. Pueden usarse mediante Anaconda y el emulador Rosetta 2, lo cual disminuye su performance. Sin embargo, dado lo prometedor del chip M1 y por el hecho de que las librerías son de fuente abierta, es sólo cuestión de tiempo que puedan correr en forma nativa sobre M1.
En otros aspectos, la MacBook incluye la pantalla Retina, capaz de lograr una mayor saturación de colores y mejor contraste entre colores, lo cual contribuye a mejores experiencias de visualización. Hasta el momento, sólo está disponible la versión con pantalla de 13 pulgadas. Se espera una versión con pantalla de 16 pulgadas, pero aún no tiene fecha prevista de lanzamiento
La herramienta más importante de un científico de datos es su propia capacidad. Las habilidades que debe tener un data scientist obviamente incluyen el manejo de herramientas informáticas que hagan el trabajo pesado, pero también debe tener capacidad de pensamiento analítico, pensamiento crítico, visión de negocio y habilidades interpersonales. La computadora que elijas para hacer ciencia de datos debe servirte como ayuda para potenciar tus propias capacidades, ahorrándote tiempo al procesar grandes cantidades de información y brindándote eficiencia en todas aquellas tareas que puedan automatizarse. Espero que entre los modelos comentados aquí puedas encontrar la notebook que mejor resuelva tus necesidades en el área de las ciencias de datos.
As an Amazon Associate I earn from qualifying purchases / Como afiliado de Amazon recibo ingresos de compras calificadas.
Escritor y periodista especializado en tecnología, desde el año 1992.
Unitech, empresa experta en la transformación digital cognitiva de poderes judiciales, informó el lanzamiento y…
Forza Power Technologies, empresa fabricante de soluciones de energía confiable, anunció el nombramiento de Juan Carlos…
ASRock, fabricante de motherboards y tarjetas gráficas, informó la presentación de su línea completa de…
ADATA Technology, fabricante de módulos de memoria y unidades de almacenamiento, y su marca de…
ORBITH, proveedor de servicios de Internet satelital, anunció la presentación en el país de su…
Sannare, el ecosistema de healthtech basado en Inteligencia Artificial, se presenta como una solución integral…
Ver comentarios