ytdl-org · BrutuZ · Mar 12, 2020 · Mar 12, 2020 · Mar 12, 2020 · Mar 12, 2020
diff --git a/youtube_dl/extractor/extractors.py b/youtube_dl/extractor/extractors.py
@@ -420,6 +420,7 @@
 from .gputechconf import GPUTechConfIE
 from .groupon import GrouponIE
 from .hbo import HBOIE
+from .hanime import HanimeIE
 from .hearthisat import HearThisAtIE
 from .heise import HeiseIE
 from .hellporno import HellPornoIE

diff --git a/youtube_dl/extractor/hanime.py b/youtube_dl/extractor/hanime.py
@@ -0,0 +1,103 @@
+# coding: utf-8
+from __future__ import unicode_literals
+
+from .common import InfoExtractor
+from ..utils import (
+    clean_html,
+    parse_filesize,
+    float_or_none,
+    int_or_none,
+    parse_iso8601,
+    unified_strdate,
+    str_or_none,
+    sanitize_url,
+    compat_str,
+    try_get,
+)
+
+
+class HanimeIE(InfoExtractor):
+    _VALID_URL = r'https?://(?:www\.)?hanime\.tv/videos/hentai/(?P<id>.+)(?:\?playlist_id=.+)?'
+    _TEST = {
+        'url': 'https://hanime.tv/videos/hentai/kuroinu-1',
+        'info_dict': {
+            'id': '33964',
+            'display_id': 'kuroinu-1',
+            'title': 'Kuroinu 1',
+            'description': 'md5:37d5bb20d4a0834bd147bc1bac588a0b',
+            'thumbnail': r're:^https?://.*\.jpg$',
+            'release_date': '20120127',
+            'upload_date': '20140509',
+            'timestamp': 1399624976,
+            'creator': 'Magin Label',
+            'view_count': int,
+            'like_count': int,
+            'dislike_count': int,
+            'tags': list,
+            'ext': 'mp4',
+        },
+        'params': {
+            # m3u8 download
+            'skip_download': True,
+        },
+    }
+
+    def _real_extract(self, url):
+        video_slug = self._match_id(url)
+        page_json = self._html_search_regex(r'__NUXT__=({.+?});<\/script>', self._download_webpage(url, video_slug), 'Inline JSON')
+        page_json = try_get(self._parse_json(page_json, video_slug), lambda x: x['state']['data']['video']['hentai_video'], dict) or {}
+        api_json = try_get(self._download_json(
+            'https://members.hanime.tv/api/v3/videos_manifests/%s' % video_slug,
+            video_slug,
+            'API Call', headers={'X-Directive': 'api'}), lambda x: x['videos_manifest']['servers'], list) or []
+        tags = []
+        for tag in page_json.get('hentai_tags', []):
+            if tag.get('text'):
+                tags.append(tag.get('text'))
+        thumbnails = []
+        if '/covers/' in page_json.get('poster_url'):
+            thumbnails.append({'preference': 0, 'id': 'Poster', 'url': page_json['poster_url']})
+        elif '/posters/' in page_json.get('poster_url'):
+            thumbnails.append({'preference': 1, 'id': 'Cover', 'url': page_json['cover_url']})
+        else:
+            thumbnails = None
+        formats = []
+        video_id = None
+        for server in api_json:
+            for stream in server['streams']:
+                if stream.get('compatibility') != 'all':
+                    continue
+                if not video_id:
+                    video_id = compat_str(stream['id'])
+                item_url = sanitize_url(stream.get('url')) or sanitize_url('https://hanime.tv/api/v1/m3u8s/%s.m3u8' % stream['id'])
+                width = int_or_none(stream.get('width'))
+                height = int_or_none(stream.get('height'))
+                format = {
+                    'width': width,
+                    'height': height,
+                    'filesize_approx': float_or_none(parse_filesize('%sMb' % stream.get('filesize_mbs'))),
+                    'protocol': 'm3u8',
+                    'format_id': 'mp4-%sp' % stream.get('height'),
+                    'ext': 'mp4',
+                    'url': item_url,
+                }
+                formats.append(format)
+        formats.reverse()
+
+        return {
+            'id': video_id or page_json.get('id') or video_slug,
+            'display_id': video_slug,
+            'title': page_json.get('name') or video_slug.replace('-', ' '),
+            'description': clean_html(page_json.get('description')),
+            'thumbnails': thumbnails,
+            'release_date': unified_strdate(page_json.get('released_at') or compat_str(page_json.get('released_at_unix'))),
+            'upload_date': unified_strdate(page_json.get('created_at') or compat_str(page_json.get('created_at_unix'))),
+            'timestamp': int_or_none(page_json.get('created_at_unix') or parse_iso8601(page_json.get('created_at'))),
+            'creator': str_or_none(page_json.get('brand')),
+            'view_count': int_or_none(page_json.get('views')),
+            'like_count': int_or_none(page_json.get('likes')),
+            'dislike_count': int_or_none(page_json.get('dislikes')),
+            'duration': float_or_none(page_json.get('duration_in_ms') / 1000),
+            'tags': tags,
+            'formats': formats,
+        }