01 Продукты
- Inference API — десятки open-source моделей через единый API.
- Fine-tuning — обучение Llama / Mixtral на своих данных через веб-интерфейс.
- Dedicated endpoints — managed-инференс на выделенных GPU.
- Embeddings — open-source модели (BGE-M3 и др.).
- Reranker — open-source реранкеры.
02 Когда выбирать
- Массовые задачи. Классификация, извлечение, простые ответы — цена в 15-30x ниже Claude.
- Fine-tuning Llama / Mixtral. Удобный UI, документация.
- Без vendor lock. Свободно переключаетесь между моделями.
- Multi-region. Доступны US/EU endpoints для compliance.
03 Together vs Groq
| Параметр | Together AI | Groq |
|---|---|---|
| Скорость | 30-100 т/с | 300-500 т/с |
| Цена Llama 70B | $0.20-0.50 | $0.59-0.79 |
| Fine-tuning | есть | нет |
| Каталог | десятки моделей | ~10 моделей |
Together — дешевле и шире каталог. Groq — быстрее, но меньше моделей.