dense-video-captioning

Here are 9 public repositories matching this topic...

JaywongWang / DenseVideoCaptioning

Official Tensorflow Implementation of the paper "Bidirectional Attentive Fusion with Context Gating for Dense Video Captioning" in CVPR 2018, with code, model and prediction results.

Updated Jul 8, 2019
Python

ttengwang / dense-video-captioning-pytorch

Star

Second-place solution to dense video captioning task in ActivityNet Challenge (CVPR 2020 workshop)

hierarchical-rnn dense-video-captioning activitynet-captions activitynet-challenge

Updated Aug 25, 2021
Python

ttengwang / PDVC

Star

End-to-End Dense Video Captioning with Parallel Decoding (ICCV 2021)

dense-video-captioning youcook2 activitynet-captions video-paragraph-captioning

Updated Jan 3, 2024
Python

v-iashin / MDVC

Star

PyTorch implementation of Multi-modal Dense Video Captioning (CVPR 2020 Workshops)

audio visual speech pytorch transformer multi-modal i3d dense-video-captioning activitynet-captions cvpr-workshop

Updated Apr 8, 2023
Python

zjr2000 / GVL

Star

Official implementation for paper Learning Grounded Vision-Language Representation for Versatile Understanding in Untrimmed Videos

pytorch representation-learning pytorch-implementation dense-video-captioning video-grounding video-language temporal-localization long-video-understanding

Updated Dec 8, 2023
Python

ailab-kyunghee / CM2_DVC

Star

[CVPR 2024] Do you remember? Dense Video Captioning with Cross-Modal Memory Retrieval

video retrieval memory multi-modal dvc dense-video-captioning cross-modal-retrieval video-cap

Updated Jun 19, 2024
Python

josch14 / semantic-metadata-extraction-from-videos

Star

Semantic Metadata Extraction from Generated Video Captions (CD-MAKE 2023).

framework video text entities relations dense-video-captioning semantic-metadata

Updated Oct 24, 2023
Python

gyxxyg / VTG-LLM

Star

[Preprint] VTG-LLM: Integrating Timestamp Knowledge into Video LLMs for Enhanced Video Temporal Grounding

dense-video-captioning moment-retrieval video-highlight-detection multi-modal-large-language-model video-large-language-models

Updated Oct 10, 2024
Python

gyxxyg / TRACE

Star

[Preprint] TRACE: Temporal Grounding Video LLM via Casual Event Modeling

dense-video-captioning video-highlight-detection multimodal-large-language-models video-large-language-models video-temporal-grounding

Updated Nov 8, 2024
Python

Improve this page

Add a description, image, and links to the dense-video-captioning topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the dense-video-captioning topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

dense-video-captioning

Here are 9 public repositories matching this topic...

JaywongWang / DenseVideoCaptioning

ttengwang / dense-video-captioning-pytorch

ttengwang / PDVC

v-iashin / MDVC

zjr2000 / GVL

ailab-kyunghee / CM2_DVC

josch14 / semantic-metadata-extraction-from-videos

gyxxyg / VTG-LLM

gyxxyg / TRACE

Improve this page

Add this topic to your repo