Como cortar gameplay em clipes verticais que funcionam
Gameplay no 9:16 é um quebra-cabeça. Você tem a ação, o facecam e o HUD pra encaixar numa tela magra. Vou te mostrar como a gente resolve isso no Cut.Pro sem espremer tudo num quadradinho ilegível.

Como cortar gameplay em clipes verticais que funcionam
Cortar gameplay pra vertical não tem nada a ver com cortar podcast. Num papo de duas pessoas você tem dois rostos, fim. Numa gameplay você tem a tela do jogo, o facecam, o HUD, o chat e às vezes três overlays piscando ao mesmo tempo. Tudo isso precisa caber num retângulo de 9:16, que é estreito pra caramba, sem virar uma sopa que ninguém entende.
Já perdi a conta de quantos streamers bons vi torrarem uma jogada perfeita porque o clipe ficou confuso. A play era de cair o queixo e, no celular, ninguém sacou o que rolou. Esse post é o jeito que a gente pensa isso aqui dentro, do enquadramento ao áudio.
Ação e rosto na mesma tela
A primeira pergunta de todo clipador de games é a mesma: mostro o jogo ou mostro o streamer? Quase sempre os dois. Mas não do mesmo jeito o tempo inteiro.
O layout que mais entrega resultado é o empilhado. Facecam no terço de cima, gameplay no resto. Você dá rosto e contexto na mesma tela. O espectador vê a reação e vê o que causou a reação, que é a mesma lógica de qualquer clipe que prende: emoção e causa juntas.
O detalhe que quase todo mundo erra é achar que dá pra enfiar a tela inteira do jogo na metade de baixo. Pensa num FPS, ele é 16:9 deitado. Se você espreme isso num espaço quase quadrado, o personagem vira um pontinho de três pixels e o clipe morre. O caminho é cortar o jogo no ponto de ação e jogar o resto fora. Onde está a mira, onde está o inimigo, onde a coisa acontece.
É aqui que o enquadramento e reframe automático ganha o jogo. Em vez de você marcar o crop quadro a quadro enquanto a câmera do jogo roda igual maluca, o sistema persegue o centro de interesse e segue o falante. O facecam continua enquadrado quando o streamer se joga pra trás na cadeira no susto, e a ação do jogo não sai do quadro.
Quais momentos viram clipe
Tem streamer que joga lindo por uma hora e não rende um corte. Tem streamer mediano que vive de viral. A diferença não está na skill. Está na virada.
Os que clipam sozinhos são poucos e você reconhece de longe. O clutch, aquele 1v3 que estava perdido e virou, ninguém precisa entender de Valorant pra sentir a tensão subir. O fail, cair do mapa, errar o tiro mais fácil da vida, morrer pro boss com a barra de vida no talo. Fail é universal, todo mundo ri. O rage é polêmico mas funciona: o grito, o teclado apanhando, a frase que vira meme no dia seguinte. Só não deixe o canal inteiro virar isso. E o susto de verdade, o pulo no jogo de terror, a risada que o cara não segura. Reação real é o que separa um clipe de gameplay de mais um vídeo de jogo perdido no feed.
A regra que eu uso é seca. Se o trecho não tem uma virada emocional clara nos três primeiros segundos, ele não é clipe. É highlight de portfólio, que é outra coisa, guarda pro YouTube.
O começo decide tudo
No vertical o dedo do espectador rola o feed em milésimo de segundo. Se os primeiros segundos forem "calma, deixa eu explicar o contexto", acabou. Já subiu pro próximo vídeo e nem percebeu o seu.
O truque é começar no pico, ou pouquinho antes dele. Se a jogada boa estoura no segundo oito, comece no segundo cinco, com a tensão já montando. Quinze segundos de andança até a ação é suicídio. Corta gordura.
Quando você puxa o material do clipping para Twitch e Kick com IA, boa parte da caça ao pico já vem mastigada. A ferramenta marca os trechos de mais energia: picos de áudio, reação da pessoa, agito do chat. O ajuste fino é seu, mas você não precisa varrer três horas de VOD no olho que nem condenado.
Legenda no gameplay
Legenda em clipe de gameplay tem uma armadilha que pega gente experiente. A tela já está lotada. Tem HUD, tem mira, tem número piscando. Joga uma legenda gigante no meio disso e vira poluição visual pura.
O que funciona é simples. Legenda na faixa entre o facecam e o jogo, ou bem lá embaixo, longe do HUD, em posição fixa, sem ficar dançando pela tela. Palavra-chave destacada na cor, não a frase inteira berrando. O olho precisa pegar o sentido num relance. E sincronia palavra por palavra: quando o streamer xinga, a palavra aparece no instante exato do palavrão. Isso amarra o som ao texto e segura a atenção.
Lembra de uma coisa que mete medo em quem ignora legenda: metade da galera assiste no mudo. No busão, na fila, na cama de madrugada com o namorado dormindo do lado. A legenda é o que salva o clipe nessas horas. Sem ela, metade do impacto da reação evapora.
HUD legível sem espremer o jogo
O HUD conta a história. Vida no vermelho, munição zerando, timer correndo. Às vezes o HUD é a piada inteira, tipo morrer com 1 de vida depois de dez minutos de tensão.
O erro é querer mostrar o HUD todo o tempo inteiro. Não cabe, simples assim. A saída é ser seletivo. No momento normal, foco na ação central. No momento em que o número importa, um zoom rápido nele, ou uma seta, ou a legenda apontando "1 de vida". Você dirige o olho do espectador pro detalhe certo na hora certa, em vez de despejar tudo na cara dele e torcer pra ele achar sozinho.
Pensa como editor de cinema, não como print de tela. Cada segundo mostra o que precisa ser visto naquele segundo, nada mais.
Jogo e voz brigando pelo áudio
Esse ponto separa amador de profissional e quase ninguém presta atenção nele. Numa gameplay tem duas camadas de som disputando o ouvido: o jogo (tiros, trilha, explosão) e a voz do streamer.
A voz vem na frente. A reação é o que vende o clipe, então a fala precisa estar limpa e por cima. O áudio do jogo entra de apoio, dando tensão e clima, mas sem cobrir a voz. Quando o cara grita o clutch, eu deixo o som do jogo respirar junto do grito, nunca a ponto de abafar.
Tem um perigo silencioso aqui. Pico de áudio do jogo, tipo uma explosão estourada, costuma ser o gatilho do clipe, mas também estoura no fone de quem assiste. Vale equilibrar pra não machucar ouvido. Clipe que faz a pessoa arrancar o fone correndo é clipe que ela nunca vai compartilhar.
Cortando direto da live
A maior parte do material de gameplay nasce em live de Twitch ou Kick. E rever horas de transmissão atrás dos dois minutos que prestam é, na minha opinião, o trabalho mais chato que existe nesse ramo. Pior que renderizar.
O fluxo que eu uso pega o VOD ou a live, joga no Cut.Pro e deixa o clipping nativo de Twitch e Kick varrer por mim. Ele acha os picos, aplica o reframe vertical seguindo rosto e ação, gera as legendas e devolve vários cortes prontos. Eu reviso, mexo no que quero, posto. O que tomava uma tarde inteira cabe em alguns minutos, e sobra tempo pra fazer o que paga a conta, que é jogar e transmitir.
Pra quem clipa pros outros isso vira escala. Dá pra atender cinco streamers no tempo que antes mal dava pra um, sem virar refém da timeline.
No fim a gameplay vertical é um exercício de prioridade. Em cada segundo você decide a única coisa que o celular do espectador precisa ver, e joga o resto pra fora do quadro. Quem entende isso transforma horas de live num feed que cresce sozinho. Quem não entende fica espremendo um FPS inteiro num quadradinho e se perguntando por que ninguém clica.
Continue lendo
Mais insights e tutoriais pra você crescer como criador de conteúdo.


