инста и ютуб работают, вк пока нет

This commit is contained in:
vrubelroman 2025-12-10 14:46:09 +03:00
commit ae8c7aba93
12 changed files with 713 additions and 0 deletions

11
.dockerignore Normal file
View file

@ -0,0 +1,11 @@
__pycache__
*.pyc
*.pyo
*.pyd
.Python
downloads/
*.log
.git
.gitignore
README.md

14
.gitignore vendored Normal file
View file

@ -0,0 +1,14 @@
__pycache__/
*.py[cod]
*$py.class
*.so
.Python
video/
*.log
.env
.venv
env/
venv/
stats.json
instagram_cookies.txt

25
Dockerfile Normal file
View file

@ -0,0 +1,25 @@
FROM python:3.11-slim
# Устанавливаем зависимости для yt-dlp
RUN apt-get update && apt-get install -y \
ffmpeg \
wget \
&& rm -rf /var/lib/apt/lists/*
WORKDIR /app
# Копируем requirements и устанавливаем зависимости
COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt
# Копируем код приложения
COPY . .
# Создаем директорию для загрузок
RUN mkdir -p video
# Увеличиваем таймауты для SSL (в секундах)
ENV PYTHONUNBUFFERED=1
CMD ["python", "bot.py"]

View file

@ -0,0 +1,51 @@
# Инструкция по получению cookies для Instagram
## Вариант 1: Использование расширения браузера (рекомендуется)
1. Установите расширение для экспорта cookies:
- Chrome: [Get cookies.txt LOCALLY](https://chrome.google.com/webstore/detail/get-cookiestxt-locally/cclelndahbckbenkjhflpdbgdldlbecc)
- Firefox: [cookies.txt](https://addons.mozilla.org/en-US/firefox/addon/cookies-txt/)
2. Откройте Instagram и войдите в свой аккаунт: https://www.instagram.com
3. Кликните на расширение и выберите "Export cookies.txt"
4. Сохраните файл как `instagram_cookies.txt` в корень проекта (там же, где docker-compose.yml)
## Вариант 2: Ручной экспорт через DevTools
1. Откройте Instagram в браузере и войдите: https://www.instagram.com
2. Откройте DevTools (F12) → вкладка Application/Storage → Cookies → https://www.instagram.com
3. Скопируйте нужные cookies в формате Netscape:
```
# Netscape HTTP Cookie File
.instagram.com TRUE / FALSE 1735689600 sessionid YOUR_SESSION_ID
.instagram.com TRUE / FALSE 1735689600 csrftoken YOUR_CSRF_TOKEN
```
4. Сохраните в файл `instagram_cookies.txt`
## Вариант 3: Использование yt-dlp для экспорта
```bash
# Экспорт cookies из браузера Chrome
yt-dlp --cookies-from-browser chrome --cookies instagram_cookies.txt https://www.instagram.com
# Или из Firefox
yt-dlp --cookies-from-browser firefox --cookies instagram_cookies.txt https://www.instagram.com
```
## Важно!
- Файл должен называться `instagram_cookies.txt`
- Разместите его в корне проекта (рядом с docker-compose.yml)
- Cookies имеют срок действия - возможно, потребуется обновлять их периодически
- Не коммитьте файл в git (он уже добавлен в .gitignore)
После добавления файла перезапустите контейнер:
```bash
docker compose restart bot
```

30
README.md Normal file
View file

@ -0,0 +1,30 @@
# Telegram Video Download Bot
Бот для скачивания видео из различных источников (YouTube, Instagram, VK).
## Запуск
```bash
docker-compose up -d
```
## Поддерживаемые источники
- YouTube (youtube.com, youtu.be)
- Instagram (instagram.com)
- VK (vk.com, vkontakte.ru)
## Использование
1. Найдите бота в Telegram
2. Отправьте команду `/start`
3. Отправьте ссылку на видео
4. Получите скачанное видео
## Структура проекта
- `bot.py` - основной код бота
- `docker-compose.yml` - конфигурация Docker Compose
- `Dockerfile` - образ Docker для бота
- `requirements.txt` - зависимости Python

439
bot.py Normal file
View file

@ -0,0 +1,439 @@
import os
import re
import json
import logging
import asyncio
from pathlib import Path
from urllib.parse import urlparse
import yt_dlp
from telegram import Update
from telegram.ext import Application, MessageHandler, filters, ContextTypes, CommandHandler
# Настройка логирования
logging.basicConfig(
format='%(asctime)s - %(name)s - %(levelname)s - %(message)s',
level=logging.INFO
)
logger = logging.getLogger(__name__)
# Токен бота из переменной окружения
TELEGRAM_BOT_TOKEN = os.getenv('TELEGRAM_BOT_TOKEN')
# Директория для временных файлов
DOWNLOADS_DIR = Path('video')
DOWNLOADS_DIR.mkdir(exist_ok=True)
# Файл для хранения статистики
STATS_FILE = Path('stats.json')
def load_stats() -> dict:
"""Загружает статистику из файла"""
if STATS_FILE.exists():
try:
with open(STATS_FILE, 'r', encoding='utf-8') as f:
return json.load(f)
except Exception as e:
logger.error(f"Ошибка при загрузке статистики: {e}")
return {'total_downloads': 0}
return {'total_downloads': 0}
def save_stats(stats: dict):
"""Сохраняет статистику в файл"""
try:
with open(STATS_FILE, 'w', encoding='utf-8') as f:
json.dump(stats, f, ensure_ascii=False, indent=2)
except Exception as e:
logger.error(f"Ошибка при сохранении статистики: {e}")
def increment_downloads():
"""Увеличивает счетчик скачанных видео"""
stats = load_stats()
stats['total_downloads'] = stats.get('total_downloads', 0) + 1
save_stats(stats)
logger.info(f"Общее количество скачанных видео: {stats['total_downloads']}")
def detect_video_source(url: str) -> str:
"""Определяет источник видео по URL"""
domain = urlparse(url).netloc.lower()
if 'youtube.com' in domain or 'youtu.be' in domain:
return 'youtube'
elif 'instagram.com' in domain:
return 'instagram'
elif 'vk.com' in domain or 'vkontakte.ru' in domain:
return 'vk'
else:
return 'unknown'
def _safe_filename(title: str, chat_id: int) -> str:
"""Создает безопасное имя файла"""
safe_title = re.sub(r'[<>:"/\\|?*]', '', title)[:100]
return str(DOWNLOADS_DIR / f'{chat_id}_{safe_title}.%(ext)s')
async def download_youtube_video(url: str, chat_id: int, max_retries: int = 3) -> str:
"""Скачивает видео с YouTube"""
user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
last_error = None
for attempt in range(max_retries):
try:
# Получаем информацию о видео
ydl_opts_info = {
'quiet': False,
'no_warnings': False,
'user_agent': user_agent,
'socket_timeout': 30,
'extractor_args': {
'youtube': {
'player_client': ['android', 'web'],
'player_skip': ['webpage'],
},
},
'http_headers': {
'User-Agent': user_agent,
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Accept-Language': 'en-us,en;q=0.5',
'Accept-Encoding': 'gzip, deflate',
'Connection': 'keep-alive',
},
}
with yt_dlp.YoutubeDL(ydl_opts_info) as ydl:
info = ydl.extract_info(url, download=False)
video_title = info.get('title', 'video')
logger.info(f"YouTube: получена информация о видео: {video_title}")
# Скачиваем видео
ydl_opts_download = {
'format': 'bestvideo[ext=mp4]+bestaudio[ext=m4a]/best[ext=mp4]/best',
'outtmpl': _safe_filename(video_title, chat_id),
'quiet': False,
'no_warnings': False,
'user_agent': user_agent,
'socket_timeout': 30,
'extractor_args': {
'youtube': {
'player_client': ['android', 'web'],
'player_skip': ['webpage'],
},
},
'http_headers': {
'User-Agent': user_agent,
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Accept-Language': 'en-us,en;q=0.5',
'Accept-Encoding': 'gzip, deflate',
'Connection': 'keep-alive',
},
}
logger.info(f"YouTube: начинаем скачивание (попытка {attempt + 1}/{max_retries})")
with yt_dlp.YoutubeDL(ydl_opts_download) as ydl:
loop = asyncio.get_event_loop()
await loop.run_in_executor(None, lambda: ydl.download([url]))
# Находим скачанный файл
downloaded_files = list(DOWNLOADS_DIR.glob(f'{chat_id}_*'))
if downloaded_files:
downloaded_files.sort(key=lambda x: x.stat().st_mtime, reverse=True)
return str(downloaded_files[0])
else:
raise Exception("Файл не был найден после скачивания")
except Exception as e:
last_error = e
logger.warning(f"YouTube: попытка {attempt + 1}/{max_retries} не удалась: {e}")
if attempt < max_retries - 1:
await asyncio.sleep((attempt + 1) * 2)
raise last_error or Exception("Неизвестная ошибка при скачивании с YouTube")
async def download_instagram_video(url: str, chat_id: int, max_retries: int = 3) -> str:
"""Скачивает видео с Instagram - используем cookies с правильными заголовками"""
cookies_file = os.getenv('INSTAGRAM_COOKIES_FILE', 'instagram_cookies.txt')
cookies_file_path = Path(cookies_file)
# Парсим cookies для получения csrf token (формат Netscape)
csrf_token = None
sessionid = None
if cookies_file_path.exists():
try:
with open(cookies_file_path, 'r') as f:
for line in f:
line = line.strip()
if not line or line.startswith('#'):
continue
parts = line.split('\t')
if len(parts) >= 7:
domain = parts[0]
# Ищем только cookies от instagram.com
if 'instagram' in domain.lower():
cookie_name = parts[5] # Имя cookie
cookie_value = parts[6] # Значение cookie
if cookie_name == 'csrftoken':
csrf_token = cookie_value
elif cookie_name == 'sessionid':
sessionid = cookie_value
# Если нашли оба - можно выходить
if csrf_token and sessionid:
break
except Exception as e:
logger.warning(f"Не удалось прочитать cookies: {e}")
last_error = None
for attempt in range(max_retries):
try:
# Базовые настройки
ydl_opts = {
'format': 'best',
'outtmpl': str(DOWNLOADS_DIR / f'{chat_id}_%(title)s.%(ext)s'),
'quiet': False,
'no_warnings': False,
'socket_timeout': 30,
}
# Если есть файл с cookies, используем его
if cookies_file_path.exists():
# Используем абсолютный путь к cookies
ydl_opts['cookiefile'] = str(cookies_file_path.absolute())
logger.info(f"Instagram: используем cookies из {cookies_file_path}")
# Добавляем заголовки с csrf token если есть
headers = {
'Referer': 'https://www.instagram.com/',
'X-Requested-With': 'XMLHttpRequest',
}
if csrf_token:
headers['X-CSRFToken'] = csrf_token
logger.info(f"Instagram: добавлен csrf token в заголовки")
if sessionid:
logger.info(f"Instagram: sessionid найден (длина: {len(sessionid)})")
ydl_opts['http_headers'] = headers
logger.info(f"Instagram: начинаем скачивание (попытка {attempt + 1}/{max_retries})")
with yt_dlp.YoutubeDL(ydl_opts) as ydl:
loop = asyncio.get_event_loop()
await loop.run_in_executor(None, lambda: ydl.download([url]))
# Находим скачанный файл
downloaded_files = list(DOWNLOADS_DIR.glob(f'{chat_id}_*'))
if downloaded_files:
downloaded_files.sort(key=lambda x: x.stat().st_mtime, reverse=True)
return str(downloaded_files[0])
else:
raise Exception("Файл не был найден после скачивания")
except Exception as e:
last_error = e
logger.warning(f"Instagram: попытка {attempt + 1}/{max_retries} не удалась: {e}")
if attempt < max_retries - 1:
await asyncio.sleep((attempt + 1) * 2)
raise last_error or Exception("Неизвестная ошибка при скачивании с Instagram. Возможно, нужно обновить cookies.")
async def download_vk_video(url: str, chat_id: int, max_retries: int = 3) -> str:
"""Скачивает видео с VK"""
vk_user_agent = 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
last_error = None
for attempt in range(max_retries):
try:
# Получаем информацию о видео
ydl_opts_info = {
'quiet': False,
'no_warnings': False,
'user_agent': vk_user_agent,
'socket_timeout': 60, # Увеличенный таймаут для VK
'extractor_args': {
'vk': {},
},
'http_headers': {
'User-Agent': vk_user_agent,
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Accept-Language': 'ru-RU,ru;q=0.9',
'Referer': 'https://vk.com/',
'Connection': 'keep-alive',
},
# Пробуем использовать более надежные настройки SSL
'nocheckcertificate': False,
}
with yt_dlp.YoutubeDL(ydl_opts_info) as ydl:
info = ydl.extract_info(url, download=False)
video_title = info.get('title', 'vk_video')
logger.info(f"VK: получена информация о видео: {video_title}")
# Скачиваем видео
ydl_opts_download = {
'format': 'best',
'outtmpl': _safe_filename(video_title, chat_id),
'quiet': False,
'no_warnings': False,
'user_agent': vk_user_agent,
'socket_timeout': 60, # Увеличенный таймаут для VK
'extractor_args': {
'vk': {},
},
'http_headers': {
'User-Agent': vk_user_agent,
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Accept-Language': 'ru-RU,ru;q=0.9',
'Referer': 'https://vk.com/',
},
}
logger.info(f"VK: начинаем скачивание (попытка {attempt + 1}/{max_retries})")
with yt_dlp.YoutubeDL(ydl_opts_download) as ydl:
loop = asyncio.get_event_loop()
await loop.run_in_executor(None, lambda: ydl.download([url]))
# Находим скачанный файл
downloaded_files = list(DOWNLOADS_DIR.glob(f'{chat_id}_*'))
if downloaded_files:
downloaded_files.sort(key=lambda x: x.stat().st_mtime, reverse=True)
return str(downloaded_files[0])
else:
raise Exception("Файл не был найден после скачивания")
except Exception as e:
last_error = e
logger.warning(f"VK: попытка {attempt + 1}/{max_retries} не удалась: {e}")
if attempt < max_retries - 1:
await asyncio.sleep((attempt + 1) * 2)
raise last_error or Exception("Неизвестная ошибка при скачивании с VK")
async def download_video(url: str, chat_id: int, max_retries: int = 3) -> str:
"""Главная функция скачивания - вызывает нужную функцию в зависимости от источника"""
source = detect_video_source(url)
logger.info(f"Определен источник: {source} для URL: {url}")
if source == 'youtube':
return await download_youtube_video(url, chat_id, max_retries)
elif source == 'instagram':
return await download_instagram_video(url, chat_id, max_retries)
elif source == 'vk':
return await download_vk_video(url, chat_id, max_retries)
else:
raise Exception("Пардон, не умеем работать с этим источником")
async def handle_message(update: Update, context: ContextTypes.DEFAULT_TYPE):
"""Обрабатывает сообщения от пользователей"""
if not update.message or not update.message.text:
return
url = update.message.text.strip()
chat_id = update.message.chat_id
# Проверяем, является ли сообщение URL
if not (url.startswith('http://') or url.startswith('https://')):
await update.message.reply_text(
"Пожалуйста, отправьте ссылку на видео.\n"
"Поддерживаемые источники:\n"
"• YouTube (youtube.com, youtu.be)\n"
"• Instagram (instagram.com)\n"
"• VK (vk.com)\n\n"
"Для других источников: Пардон, не умеем 😅"
)
return
# Проверяем источник до начала обработки
source = detect_video_source(url)
if source == 'unknown':
await update.message.reply_text("Пардон, не умеем работать с этим источником 😅")
return
# Отправляем сообщение о начале обработки
status_message = await update.message.reply_text("🔍 Обрабатываю ссылку...")
try:
# Скачиваем видео
await status_message.edit_text("⬇️ Скачиваю видео...")
video_path = await download_video(url, chat_id)
# Отправляем файл пользователю
await status_message.edit_text("📤 Отправляю видео...")
video_file = open(video_path, 'rb')
await update.message.reply_video(
video=video_file,
caption="✅ Видео готово!",
supports_streaming=True
)
video_file.close()
# Увеличиваем счетчик скачанных видео
increment_downloads()
# Удаляем временный файл
try:
os.remove(video_path)
logger.info(f"Удален временный файл: {video_path}")
except Exception as e:
logger.warning(f"Не удалось удалить файл {video_path}: {e}")
await status_message.delete()
except Exception as e:
logger.error(f"Ошибка: {e}")
error_msg = f"❌ Произошла ошибка при обработке видео:\n{str(e)}"
await status_message.edit_text(error_msg)
async def start_command(update: Update, context: ContextTypes.DEFAULT_TYPE):
"""Обрабатывает команду /start"""
await update.message.reply_text(
"👋 Привет! Я бот для скачивания видео.\n\n"
"Просто отправь мне ссылку на видео, и я скачаю его для тебя.\n\n"
"Поддерживаемые источники:\n"
"• YouTube (youtube.com, youtu.be)\n"
"• Instagram (instagram.com)\n"
"• VK (vk.com)\n\n"
"Команды:\n"
"/start - Начать работу\n"
"/stat - Статистика скачанных видео\n\n"
"Отправь ссылку на видео:"
)
async def stat_command(update: Update, context: ContextTypes.DEFAULT_TYPE):
"""Обрабатывает команду /stat"""
stats = load_stats()
total = stats.get('total_downloads', 0)
await update.message.reply_text(
f"📊 Статистика скачанных видео:\n\n"
f"Всего скачано: {total} видео"
)
def main():
"""Главная функция для запуска бота"""
if not TELEGRAM_BOT_TOKEN:
logger.error("TELEGRAM_BOT_TOKEN не установлен!")
return
# Создаем приложение
application = Application.builder().token(TELEGRAM_BOT_TOKEN).build()
# Регистрируем обработчики
application.add_handler(MessageHandler(filters.TEXT & ~filters.COMMAND, handle_message))
application.add_handler(CommandHandler("start", start_command))
application.add_handler(CommandHandler("stat", stat_command))
# Запускаем бота
logger.info("Бот запущен")
application.run_polling(allowed_updates=Update.ALL_TYPES)
if __name__ == '__main__':
main()

18
docker-compose.yml Normal file
View file

@ -0,0 +1,18 @@
services:
bot:
build: .
container_name: video_download_bot
restart: unless-stopped
environment:
- TELEGRAM_BOT_TOKEN=8531436675:AAFRoIlqP1PRDy_da3NZQM0L8uQGHtvhTII
volumes:
- ./video:/app/video
- ./instagram_cookies.txt:/app/instagram_cookies.txt
- ./stats.json:/app/stats.json
networks:
- bot_network
networks:
bot_network:
driver: bridge

24
get_cookies.sh Executable file
View file

@ -0,0 +1,24 @@
#!/bin/bash
# Простой способ получить cookies Instagram
echo "Выберите способ получения cookies:"
echo "1) Автоматически из браузера Chrome (нужно чтобы Chrome был запущен)"
echo "2) Автоматически из браузера Firefox (нужно чтобы Firefox был запущен)"
echo ""
read -p "Ваш выбор (1 или 2): " choice
if [ "$choice" = "1" ]; then
docker compose exec bot yt-dlp --cookies-from-browser chrome --cookies /app/instagram_cookies.txt --no-download https://www.instagram.com 2>&1 | head -10
echo ""
echo "✅ Cookies сохранены в instagram_cookies.txt"
elif [ "$choice" = "2" ]; then
docker compose exec bot yt-dlp --cookies-from-browser firefox --cookies /app/instagram_cookies.txt --no-download https://www.instagram.com 2>&1 | head -10
echo ""
echo "✅ Cookies сохранены в instagram_cookies.txt"
else
echo "Неверный выбор"
exit 1
fi
echo ""
echo "Теперь перезапустите бота: docker compose restart bot"

51
get_cookies_local.sh Executable file
View file

@ -0,0 +1,51 @@
#!/bin/bash
# Получение cookies Instagram локально (на вашем компьютере, не в Docker)
echo "========================================="
echo "Получение cookies Instagram"
echo "========================================="
echo ""
echo "ВАЖНО: Запустите эту команду на вашем компьютере (не в Docker),"
echo " после того как вы залогинились в Instagram в браузере"
echo ""
echo "Выберите браузер:"
echo "1) Chrome/Chromium"
echo "2) Firefox"
read -p "Ваш выбор (1 или 2): " choice
if [ "$choice" = "1" ]; then
# Для Chrome
if command -v yt-dlp &> /dev/null; then
yt-dlp --cookies-from-browser chrome --cookies ./instagram_cookies.txt --no-download https://www.instagram.com
else
echo "❌ yt-dlp не установлен. Установите: pip install yt-dlp"
echo ""
echo "Или используйте расширение браузера:"
echo "Chrome: https://chrome.google.com/webstore/detail/get-cookiestxt-locally/cclelndahbckbenkjhflpdbgdldlbecc"
exit 1
fi
elif [ "$choice" = "2" ]; then
# Для Firefox
if command -v yt-dlp &> /dev/null; then
yt-dlp --cookies-from-browser firefox --cookies ./instagram_cookies.txt --no-download https://www.instagram.com
else
echo "❌ yt-dlp не установлен. Установите: pip install yt-dlp"
echo ""
echo "Или используйте расширение браузера:"
echo "Firefox: https://addons.mozilla.org/en-US/firefox/addon/cookies-txt/"
exit 1
fi
else
echo "Неверный выбор"
exit 1
fi
if [ -f "./instagram_cookies.txt" ]; then
echo ""
echo "✅ Cookies сохранены в instagram_cookies.txt"
echo ""
echo "Теперь перезапустите бота:"
echo " docker compose restart bot"
else
echo "❌ Ошибка: файл cookies не создан"
fi

24
get_instagram_cookies.sh Executable file
View file

@ -0,0 +1,24 @@
#!/bin/bash
# Скрипт для получения cookies Instagram через yt-dlp
echo "Получение cookies Instagram из браузера..."
echo ""
echo "Выберите браузер:"
echo "1) Chrome"
echo "2) Firefox"
read -p "Введите номер (1 или 2): " browser
if [ "$browser" = "1" ]; then
BROWSER="chrome"
elif [ "$browser" = "2" ]; then
BROWSER="firefox"
else
echo "Неверный выбор"
exit 1
fi
echo "Получаю cookies из $BROWSER..."
docker compose exec bot yt-dlp --cookies-from-browser $BROWSER --cookies /app/instagram_cookies.txt https://www.instagram.com 2>&1 | head -5
echo ""
echo "Cookies должны быть сохранены в instagram_cookies.txt"

4
requirements.txt Normal file
View file

@ -0,0 +1,4 @@
python-telegram-bot==20.7
yt-dlp>=2024.12.13
requests==2.31.0

22
update_instagram_cookies.sh Executable file
View file

@ -0,0 +1,22 @@
#!/bin/bash
# Обновление cookies Instagram с использованием логина/пароля
LOGIN="vrubelroman@gmail.com"
PASSWORD="VRKshtein07"
echo "Обновление cookies Instagram..."
echo "Логин: $LOGIN"
# Используем yt-dlp для обновления cookies через браузер
# Но сначала нужно зайти в браузер вручную, так как yt-dlp не поддерживает прямую авторизацию
echo ""
echo "ВАЖНО: yt-dlp не поддерживает прямую авторизацию через логин/пароль."
echo "Нужно:"
echo "1. Откройте Instagram в браузере: https://www.instagram.com"
echo "2. Войдите с вашими учетными данными"
echo "3. Затем выполните:"
echo ""
echo " yt-dlp --cookies-from-browser chrome --cookies ./instagram_cookies.txt --no-download https://www.instagram.com"
echo ""
echo "Или используйте расширение браузера для экспорта cookies."