Перейти до вмісту

Ray

Матеріал з K2 ERP Wiki

До них належать:

def increment(self):

Потрібно контролювати: </syntaxhighlight> class Counter:

results = ray.get(refs)

  • Ray Core — базовий distributed runtime;
  • Ray Data — distributed data processing;
  • Ray Train — distributed model training і fine-tuning;
  • Ray Tune — hyperparameter tuning;
  • Ray Serve — model serving і scalable inference;
  • RLlib — reinforcement learning;
  • Ray Clusters — запуск Ray на локальних машинах, VM, Kubernetes або cloud;
  • KubeRay — запуск і керування Ray у Kubernetes. критично: reinforcement learning складний сам по собі. Помилка: додавати Ray до будь-якого Python-коду лише “для швидкості”.
  • створювати RayCluster;
  • керувати Ray workloads у Kubernetes;
  • запускати Ray jobs;
  • масштабувати workers;
  • інтегрувати Ray із cloud-native infrastructure;
  • запускати AI workloads у Kubernetes;
  • використовувати Kubernetes scheduling, networking і observability. Ray Core — це базовий distributed computing framework у Ray. Практична роль: KubeRay потрібен командам, які вже використовують Kubernetes і хочуть запускати Ray workloads у cloud-native середовищі. print(ray.get(counter.increment.remote()))

! Ray так само можна порівняти з Dask. Actor у Ray — це stateful distributed object.== Відповідальне використання ==

  • офіційний сайт Ray. Висновок: Dask зручний для parallel data workflows у стилі pandas/NumPy, а Ray — для ширших distributed AI і Python applications. :contentReference [oaicite:1]{index=1}

Objects у Ray — це інформаційні дані, які створюються tasks або actors і зберігаються в distributed object store. Ray Core надає три основні примітиви:

через Практична роль: Ray Data користувачі можуть опрацьовувати великі datasets і передавати їх у training або inference pipeline. критично: Ray не робить повільний або погано спроєктований код автоматизовано швидким.== Ray і Scikit-learn ==

Ray Serve

Під час роботи з Ray потрібно уважно ставитися до даних, які передаються між tasks, actors, object store і cluster nodes.

Ray можна розглядати як distributed runtime і набір AI-бібліотек для масштабування Python та ML-застосунків. Це дає можливість:

  • tasks — розподілені функції;
  • actors — stateful distributed objects;
  • objects — distributed objects у shared-memory object store. * RLlib documentation. Ray cluster здатна працювати:
== Actors ==

офіційний сайт Ray by Anyscale описує Ray як open source framework для managing, executing and optimizing compute needs, з фокусом на AI workloads: data processing, training і serving.</div>
== Batch inference ==
<div style="background:#eef2ff; border-left:6px solid #4f46e5; padding:12px; margin:12px 0;">

'''Ray''' — це open-source фреймворк для масштабування Python і AI workloads. Dask

</div>

<div style="background:#fef2f2; border-left:6px solid #ef4444; padding:12px; margin:12px 0;">

* distributed training;
* hyperparameter tuning;
* serving моделей;
* batch inference;
* data preprocessing;
* experiment orchestration. * масштабувати Python-функції;
* масштабувати Python-класи;
* запускати distributed ML code;
* використовувати familiar Python APIs;
* поєднувати NumPy, pandas, PyTorch, TensorFlow та інші бібліотеки;
* запускати jobs локально або на cluster. Ray потрібен тоді, коли звичайного локального Python-коду вже недостатньо.<syntaxhighlight lang="text">

* занадто дрібні tasks;
* занадто частий `ray.get`;
* передача великих objects без потреби;
* відсутність resource annotations;
* неправильне планування GPU;
* відсутність retry logic;
* відсутність checkpointing;
* ігнорування object store memory;
* запуск cluster без observability;
* відкритий dashboard;
* неконтрольовані cloud costs;
* відсутність тестів перед масштабуванням;
* відсутність cleanup після jobs. Доступи, firewall, authentication, network policies і secrets management потрібно налаштовувати окремо. '''Ray Cluster''' — це набір машин або worker nodes, на яких запускається Ray. Інструмент: Ray Core tasks. Для невеликого prototype Ray можна запускати локально, а Kubernetes залишити для production або platform engineering. Для важливих workload потрібно проєктувати checkpointing, retry, idempotency і recovery. Офіційна документація описує Ray як open-source framework to build and scale ML and Python applications, а GitHub-репозиторій — як unified framework for scaling AI and Python applications із core distributed runtime і AI libraries.</div>
Результат: scalable inference pipeline з контрольованим використанням CPU/GPU.== Див. так само ==

<div style="background:#fff4e5; border-left:6px solid #f39c12; padding:12px; margin:12px 0;">

Офіційна документація описує RLlib як open source library for reinforcement learning, що підтримує production-level, highly scalable і fault-tolerant RL workloads через unified APIs. :contentReference [oaicite:6]{index=6}
Dashboard оптимізує бачити:
== Для чого застосовується для Ray ==
|-
| базовий фокус
| Distributed Python, AI workloads, ML training, inference, serving
| Big data processing, SQL, ETL, batch analytics
|-
| Програмна модель
| Tasks, actors, objects, AI libraries
| DataFrames, RDD, SQL, Spark jobs
|-
| AI workloads
| Сильний фокус на ML/AI, GPU, serving, tuning
| Часто застосовується для для data engineering і batch processing
|-
| Python flexibility
| Ближчий до general Python distributed computing
| Більше орієнтований на Spark execution model
|-
| Типові задачі
| Training, inference, RL, ML pipelines, distributed Python
| ETL, data lake processing, analytics, SQL workloads
|}

== Ray Dashboard ==
</div>
== Ray Core ==

</div>

'''Batch inference''' — це запуск моделі на великому наборі даних.== Ray Tune ==
== RLlib ==
<div style="background:#fdecea; border-left:6px solid #e74c3c; padding:12px; margin:12px 0;">

== Приватність даних ==

!<syntaxhighlight lang="python">

'''Суть actor:''' це distributed class instance, який живе в Ray cluster і здатна зберігати стан між remote method calls. * Ray Train documentation. У 2025 році PyTorch Foundation повідомила, що Ray став foundation-hosted project. Критерій

'''Ray Data''' — це бібліотека Ray для distributed data processing.<syntaxhighlight lang="text">
<div style="background:#e8f8f5; border-left:6px solid #16a085; padding:12px; margin:12px 0;">

'''Практична порада:''' перед впровадженням Ray варто чітко визначити bottleneck: CPU, GPU, IO, memory, network або model latency. return x * x
'''Правило:''' distributed pipeline має ті самі privacy-вимоги, що й локальний pipeline, але з більшим ризиком через більше машин, логів, cache і мережевих шляхів. '''Висновок:''' Spark сильний у big data ETL і SQL-аналітиці, а Ray часто краще підходить для гнучких Python/AI workloads, training, inference і model serving.== Безпека ==

Ray особливо тісно пов’язаний із Python. Ray Data здатна використовуватися для:

<div style="background:#fff4e5; border-left:6px solid #f39c12; padding:12px; margin:12px 0;">

* batch inference для великого dataset;
* distributed training PyTorch-моделі;
* fine-tuning LLM;
* hyperparameter tuning;
* scalable embeddings pipeline;
* reinforcement learning experiment;
* model serving API;
* distributed simulation;
* parallel web data processing;
* large-scale feature engineering;
* multi-GPU inference;
* GenAI document processing pipeline;
* Kubernetes-based AI platform. Документація Ray пояснює, що tasks і actors створюють objects та працюють з objects; remote objects можуть зберігатися будь-де в Ray cluster, а object refs використовуються для посилання на них. Можливі складнощі:
</div>
Основні конкурентні переваги Ray:

</div>

Ray Train здатна використовуватися для:

Результат: паралельний запуск trials і вибір найкращої конфігурації. '''Практична користь:''' без observability distributed system оперативно стає “чорною скринькою”, тому dashboard і logs критично важливі. '''Основна ідея:''' Ray дає можливість взяти Python-функції, класи або ML-процеси й масштабувати їх на багато ядер, машин або GPU без повного переписування застосунку під складну distributed infrastructure. '''Ray Serve''' — це бібліотека для scalable model serving. '''Практична роль:''' object store дає можливість різним tasks і actors обмінюватися даними без ручного керування файлами, sockets або message queues. refs = [square.remote(i) for i in range(5)]
<div style="background:#eafaf1; border-left:6px solid #2ecc71; padding:12px; margin:12px 0;">

Результат: training job, який масштабується з laptop до cluster. Під час роботи з Ray часто виникають типові помилки. ! import ray

Ray потрібно використовувати як infrastructure tool, а не як гарантію правильності ML-рішення. Apache Spark
Типові сценарії:

</div>

=== Model serving ===

Actors корисні, коли потрібно зберігати стан між викликами:

* тестувати локально до запуску на cluster;
* починати з малого workload;
* вимірювати performance;
* контролювати cost;
* додавати logging;
* використовувати metrics;
* налаштовувати retries;
* робити checkpointing;
* перевіряти security;
* обмежувати permissions;
* документувати cluster setup;
* перевіряти data governance;
* тестувати failure scenarios. @ray.remote
Ray часто застосовують, коли потрібно разом із PyTorch. Окремо варто відзначити actors і objects для побудови і масштабування distributed applications. :contentReference [oaicite:2]{index=2}

* model worker;
* cache;
* service object;
* simulator;
* environment у reinforcement learning;
* long-running process;
* stateful pipeline component. * distributed PyTorch training;
* TensorFlow training;
* multi-GPU training;
* fine-tuning LLM;
* training на великих datasets;
* fault-tolerant training;
* cloud training jobs;
* integration with Ray Data. Ray так само здатна використовуватися з TensorFlow. Він надає Ray Core для distributed tasks, actors і objects, а так само AI-бібліотеки для data processing, training, tuning, serving і reinforcement learning. Інструмент: Ray Data + Ray actors або Ray Serve. Ray можна використовувати у різних сценаріях. Коли remote task запускається, вона часто повертає не сам результат одразу, а reference:
'''ObjectRef''' — це посилання на object у Ray.
Просте пояснення: task — це Python-функція, яку Ray здатна виконати не лише в поточному процесі, а паралельно в distributed environment. Ray здатна доповнювати Scikit-learn у задачах, де потрібно масштабування. Якщо задача маленька або має багато дрібних залежних кроків, Ray здатна не дати виграшу. Суть Ray Serve: Ray Serve оптимізує перетворити модель або Python-функцію на scalable online service.
  • запускати обчислення асинхронно;
  • будувати dependency graph;
  • передавати результати між tasks;
  • не блокувати виконання без потреби;
  • масштабувати parallel workflows.== Висновок ==
  • локально на одній машині;
  • на кількох VM;
  • у cloud;
  • у Kubernetes;
  • через KubeRay;
  • у managed платформі;
  • у hybrid environments. Ray
  • distributed PyTorch training через Ray Train;
  • hyperparameter tuning PyTorch моделей через Ray Tune;
  • batch inference;
  • serving PyTorch моделей через Ray Serve;
  • multi-GPU experiments;
  • LLM fine-tuning;
  • reinforcement learning з PyTorch policies. У повідомленні Ray описано як open-source distributed computing framework for AI workloads, включно з data processing, model training і inference at scale. Просте пояснення: Ray cluster — це середовище, де Ray розподіляє tasks, actors і objects між різними ресурсами. Ray Dashboard — це інтерфейс для спостереження за Ray cluster. ! Інструмент: Ray Tune. критично: autoscaling потрібно налаштовувати обережно, інакше можна отримати надмірні cloud-витрати або нестабільну продуктивність. * Ray GitHub repository.
  • `@ray.remote` робить функцію distributed task;
  • `square.remote(i)` запускає task;
  • `ray.get(refs)` отримує результати;
  • Ray сам планує виконання tasks на доступних ресурсах.
self.value += 1
  • reinforcement learning;
  • multi-agent RL;
  • simulation environments;
  • policy training;
  • distributed rollout workers;
  • scalable RL experiments;
  • research і production RL workloads.

Суть: Ray — open-source проєкт, Anyscale — комерційна ERP-платформа й платформа навколо Ray. Не варто без потреби опрацьовувати або логувати:

def square(x):
ray.init()

 def __init__(self):
Можливі сценарії:
== Хороші практики роботи з Ray ==

== Ray і Anyscale ==

<div style="background:#e7f3ff; border-left:6px solid #2b7cff; padding:12px; margin:12px 0;">

<div style="background:#e8f8f5; border-left:6px solid #16a085; padding:12px; margin:12px 0;">

 self.value = 0

* результатами функцій;
* batch data;
* model weights;
* intermediate results;
* large arrays;
* references між tasks;
* даними для downstream processing. '''Головне правило:''' Ray найкраще функціонує тоді, коли задача має реальну паралельність, достатньо великі одиниці роботи і зрозумілу стратегію керування ресурсами. {| class="wikitable"
</div>
|-
| базовий фокус
| Distributed Python і AI workloads
| Parallel і distributed computing для Python data ecosystem
|-
| Типові інформаційні дані
| AI pipelines, ML, inference, actors, training
| DataFrames, arrays, delayed computations
|-
| Сильна сторона
| Tasks, actors, AI libraries, model serving
| Масштабування pandas/NumPy-like workflows
|-
| Типові користувачі
| ML engineers, AI platform teams, Python backend teams
| Data scientists, data engineers, scientific Python users
|}

<syntaxhighlight lang="python">
== Fault tolerance ==

@ray.remote

Ray Serve здатна використовуватися для:

  • container orchestration;
  • pod scheduling;
  • resource isolation;
  • cluster management;
  • integration with cloud-native tooling;
  • observability;
  • autoscaling;
  • GitOps workflows;
  • infrastructure consistency.

Distributed training

Інструмент: Ray Train. Ray

Ray Tune здатна використовуватися для:

Підказка: якщо задача має незалежні шматки роботи, Ray Core здатна бути достатнім. Ray кешує remote objects у distributed shared-memory object store. Anyscale — це компанія-користувач, пов’язана з розвитком Ray і managed-платформами для Ray workloads. * Ray Tune documentation. RLlib оптимізує масштабувати RL workloads, але не скасовує потреби в правильній постановці environment, reward function і evaluation.

критично: Kubernetes додає потужність, але й складність.== Приклади задач ==

Це дає:

  • доступ до Ray dashboard;
  • доступ до Ray cluster;
  • network exposure;
  • credentials;
  • environment variables;
  • secrets;
  • object store data;
  • model artifacts;
  • datasets;
  • logs;
  • permissions у cloud;
  • container images;
  • supply chain dependencies. Практична роль: Ray Tune дає можливість паралельно запускати багато training trials і швидше знаходити вдалі гіперпараметри.== Ray і PyTorch ==

Ray часто порівнюють з Apache Spark. * починати локально;

  • вимірювати baseline без Ray;
  • робити tasks достатньо великими;
  • уникати зайвого `ray.get`;
  • використовувати actors для stateful workloads;
  • контролювати object store memory;
  • задавати CPU/GPU resources;
  • використовувати checkpointing;
  • налаштовувати logs і metrics;
  • тестувати failure cases;
  • використовувати dashboard;
  • контролювати cloud costs;
  • захищати cluster access;
  • документувати pipeline. Ray Train — це бібліотека для distributed training і fine-tuning. Ray workloads можуть працювати з кодом, даними, моделями, ключами, cloud resources і мережевими сервісами, тому безпека виступає як критичною. У цьому прикладі:

Ray особливо корисний для ML-команд, AI platform teams, Python-розробників і data/ML engineers, яким потрібно масштабувати код від локального ноутбука до cluster або cloud. print(results)

Задача: обробити великий dataset моделлю.

Parallel Python tasks

Ray має обмеження.
Перевага: Ray дає можливість розподіляти inference workload між багатьма worker processes або GPU, що особливо корисно для AI pipeline.

Суть Ray Core: це фундамент Ray, який дає можливість перетворювати Python-функції та класи на distributed tasks і actors. Інструмент: Ray Serve. counter = Counter.remote() SEO title: Ray — open-source фреймворк для масштабування Python, AI, ML, data processing, training і serving

SEO keywords: Ray, Ray AI, Ray Python, Ray Core, Ray Data, Ray Train, Ray Tune, Ray Serve, RLlib, distributed computing, distributed Python, AI compute engine, machine learning, deep learning, model training, model serving, batch inference, hyperparameter tuning, reinforcement learning, Kubernetes, KubeRay, Anyscale, open-source AI, Python framework, масштабування Python, розподілені обчислення

</noinclude>
 {{SEO
Шаблон для службового SEO-опису сторінки. 

}}


Головна перевага: Ray дає можливість масштабувати AI і Python workloads без переходу на на 100% іншу мову або зовсім іншу програмну модель.

Задача: розгорнути модель як online inference service. * Ray Data documentation.== Ray Cluster ==

Офіційна документація описує Ray Train як scalable machine learning library for distributed training and fine-tuning, яка дає можливість масштабувати training code з однієї машини до cluster of machines і абстрагує складність distributed computing. :contentReference [oaicite:0]{index=0}

Ray Train

Джерела

ref = square.remote(10)

Рекомендовано:

  • parallel hyperparameter tuning;
  • distributed cross-validation;
  • batch inference;
  • preprocessing великого dataset;
  • запуск багатьох експериментів;
  • scalable classical ML workflows.== Типові сценарії використання ==

</syntaxhighlight>

  • distributed systems складні самі по собі;
  • debugging важчий, ніж у локальному Python;
  • network overhead здатна зменшити виграш;
  • object store здатна стати bottleneck;
  • потрібне планування ресурсів;
  • GPU scheduling потребує уваги;
  • неправильний `ray.get` здатна зламати parallelism;
  • autoscaling здатна створити cost risks;
  • production deployment потребує observability;
  • не кожну задачу варто масштабувати через Ray;
  • потрібне розуміння fault tolerance.

Distributed workloads мають ризики збоїв. Objects можуть бути:

Ray виступає як open-source фреймворком, а Anyscale надає комерційні інструменти й platform experience для розгортання Ray у production. Приклади:

Ray і TensorFlow

Загальний SEO-опис

Критично: Ray cluster не можна бездумно відкривати в публічну мережу. * Офіційна документація Ray.

Ray і PyTorch Foundation

  • персональні інформаційні дані;
  • фінансові інформаційні дані;
  • медичні інформаційні дані;
  • секретні ключі;
  • customer data;
  • приватні документи;
  • production database dumps;
  • комерційні таємниці;
  • неанонімізовані datasets.

import ray

  • grid search;
  • random search;
  • Bayesian optimization;
  • early stopping;
  • distributed trials;
  • experiment tracking;
  • tuning ML models;
  • tuning deep learning training;
  • пошуку learning rate, batch size, model size, regularization;
  • оптимізації costly experiments. Приклади:
<div style="background:#ecfdf5; border-left:6px solid #10b981; padding:12px; margin:12px 0;">
== Autoscaling ==
Задача: навчити модель на кількох GPU або машинах.== Обмеження Ray ==
== Tasks ==
'''RLlib'''  це бібліотека Ray для reinforcement learning.</div>
result = ray.get(ref)
Приклад:

<div style="background:#eafaf1; border-left:6px solid #2ecc71; padding:12px; margin:12px 0;">

! * Ray Core documentation. Ray часто застосовується для для batch inference, коли потрібно:
== Тематичні мітки ==
Ray здатна використовувати autoscaling у відповідних cluster setups. * serving ML models;
* LLM serving;
* online inference;
* microservices with Python;
* autoscaling deployments;
* model composition;
* A/B testing;
* multi-model serving;
* batch або streaming inference endpoint;
* integration with FastAPI-style workflows. '''Ray Tune'''  це бібліотека для hyperparameter tuning. Задача: підібрати learning rate, batch size і model parameters. '''Практична роль:''' PyTorch відповідає за модель і tensor operations, а Ray  за масштабування training, inference, tuning або serving. * KubeRay documentation. '''Task''' у Ray  це remote function, яка здатна виконуватися паралельно на worker процесі. Водночас Ray вимагає розуміння distributed systems: resource scheduling, memory, object store, retries, checkpointing, observability, security і cost control. '''Небезпека:''' distributed workload здатна працювати повільніше й дорожче за локальний, якщо розбити задачу неправильно або не контролювати overhead. Приклад:

KubeRay здатна допомагати:
== Object refs ==
<div style="background:#e7f3ff; border-left:6px solid #2b7cff; padding:12px; margin:12px 0;">
Результат: scalable endpoint для prediction-запитів.== Ray і Python ==

RLlib здатна використовуватися для:

Висновок: Ray не замінює TensorFlow, а здатна допомагати масштабувати TensorFlow workloads у distributed environment. це open-source фреймворк; так само реалізовано AI workloads і машинного навчання від локального комп’ютера до кластерів із багатьма CPU, GPU або TPU виступає ключовою рисою масштабування Python-застосунків забезпечується через Ray.</syntaxhighlight>

  • head node;
  • worker nodes;
  • scheduler;
  • object stores;
  • workers;
  • dashboard;
  • autoscaling mechanism залежно від setup. Потрібно правильно розбивати задачу, контролювати інформаційні дані, ресурси, пам’ять, fault tolerance і network overhead. Ray застосовується для для розподілених обчислень, data processing, model training, fine-tuning, batch inference, model serving, hyperparameter tuning, reinforcement learning, LLM applications, GenAI pipelines і high-performance Python workloads. * PyTorch Foundation announcement щодо Ray.
  • parallel Python execution;
  • distributed data processing;
  • batch inference;
  • distributed training;
  • fine-tuning моделей;
  • hyperparameter search;
  • reinforcement learning;
  • model serving;
  • multi-GPU workloads;
  • LLM inference;
  • GenAI pipelines;
  • scalable ETL;
  • distributed simulation;
  • cloud-native AI workloads. print(ray.get(counter.increment.remote()))

</syntaxhighlight>

Ray і Dask

Типові задачі:

Професійний підхід: Ray має масштабувати добре спроєктований pipeline, а не приховувати проблеми архітектури, даних або коду.</syntaxhighlight>

Ray і Spark

Objects

Задача: виконати багато незалежних обчислень. Ray cluster зазвичай містить: Ray здатна підтримувати механізми fault tolerance залежно від типу workload і налаштувань:

KubeRay

! Якщо йдеться про ML pipeline, варто дивитися Ray Data, Train, Tune або Serve.=== Hyperparameter tuning ===

Batch inference

Ray здатна працювати поверх Kubernetes через KubeRay. Результат: паралельний запуск Python-функцій на доступних CPU. :contentReference [oaicite:3]{index=3}

  • обробити мільйони документів;
  • зробити embeddings;
  • класифікувати великий dataset;
  • запускати LLM або vision model на batch;
  • використовувати GPU ефективніше;
  • паралелити inference між worker nodes;
  • поєднати data loading і model prediction.== Ray і Kubernetes ==

ray.init()

Офіційна документація Ray Core описує його як distributed computing framework із tasks. * task retry;

  • actor restart;
  • node failure handling;
  • checkpointing;
  • object reconstruction;
  • job recovery;
  • training checkpoints;
  • serving resilience. * running tasks;
  • actors;
  • nodes;
  • resources;
  • CPU/GPU usage;
  • memory usage;
  • object store usage;
  • logs;
  • errors;
  • job status;
  • performance bottlenecks.== конкурентні переваги Ray ==

Критично: fault tolerance не з’являється автоматизовано для будь-якої логіки. Практична роль: Scikit-learn добре підходить для класичного ML, а Ray здатна допомогти масштабувати експерименти навколо нього. :contentReference [oaicite:4]{index=4}

  • open-source;
  • масштабування Python-коду;
  • прості primitives: tasks, actors, objects;
  • технічна підтримка AI workloads;
  • Ray Data;
  • Ray Train;
  • Ray Tune;
  • Ray Serve;
  • RLlib;
  • технічна підтримка CPU і GPU workloads;
  • локальний і cluster запуск;
  • Kubernetes через KubeRay;
  • Python-friendly API;
  • корисність для ML, LLM і GenAI pipeline;
  • можливість масштабувати від laptop до cloud cluster.== Ray Data ==

Головна думка: Ray — це практичний distributed runtime для Python і AI, який оптимізує масштабувати data processing, training, inference і serving, але ефективність залежить від правильної архітектури workload і контролю ресурсів. * Ray Serve documentation. {| class="wikitable"

Суть Ray Train: він оптимізує масштабувати навчання моделей без ручного керування всією distributed training інфраструктурою. Autoscaling оптимізує:

критично: надмірне використання `ray.get` у неправильному місці здатна зменшити паралельність, бо код почне чекати результатів занадто рано. return self.value Перевага для Python-розробника: Ray дає можливість залишатися в Python-екосистемі й поступово переходити від локального коду до distributed execution. :contentReference [oaicite:5]{index=5}

<syntaxhighlight lang="text">

  • додавати worker nodes при зростанні навантаження;
  • зменшувати ресурси, коли workload завершується;
  • оптимізувати cost;
  • опрацьовувати burst workloads;
  • запускати distributed jobs у cloud;
  • масштабувати training, inference або data workloads. Практична роль: foundation-hosted статус підкреслює значення Ray у ширшій open-source AI infrastructure екосистемі. KubeRay — це інструментарій для запуску Ray на Kubernetes. Критерій

Ray дає можливість:

  • ETL;
  • batch inference;
  • preprocessing;
  • reading datasets;
  • transformation pipelines;
  • distributed map operations;
  • streaming data pipelines;
  • feeding data into training;
  • large-scale data workloads. Перевага: Ray об’єднує кілька частин AI pipeline — data processing, training, tuning, serving і reinforcement learning — навколо одного distributed runtime. Ray складається з:

Рекомендовано:

Типові помилки користувачів