Google Gemini lança funcionalidade para ler PDFs: veja como usar

Quer usar o Google Gemini para ler PDF? Entenda o passo a passo para fazer upload de documentos, quanto custa e quais comandos usar.

Nord Research 29/03/2024 17:07 6 min Atualizado em: 25/07/2024 09:22

Google Gemini lança funcionalidade para ler PDFs: veja como usar

O Google Gemini lançou uma nova funcionalidade que permite a leitura e análise rápida de grandes arquivos em PDF. Essa nova ferramenta aproveita o poder do modelo de linguagem do Google para extrair informações de PDFs, independentemente de estarem indexados ou pesquisáveis.

Ficou curioso? Confira o artigo abaixo e entenda como o Google Gemini funciona para ler PDFs, como fazer o upload e quais comandos solicitar. Acompanhe!

Google Gemini lança funcionalidade para ler PDF

Em fevereiro de 2024, o Google Gemini (antigo Google Bard) lançou uma nova funcionalidade que permite a leitura de documentos em PDF. Isso é possível graças ao modelo de linguagem Inteligência Artificial (IA) do Google, que pode gerar texto a partir de qualquer entrada.

Uma das aplicações desse modelo é a capacidade de recuperar informações de PDFs, mesmo que não sejam indexadas ou pesquisáveis.

Durante a apresentação do Gemini 1.5 Pro, o Google usou a ferramenta para analisar o PDF com a transcrição da missão Apollo 11 como exemplo. O algoritmo conseguiu ler as 402 páginas do documento e fornecer respostas em questão de segundos.

O Gemini 1.5 Pro consegue processar materiais com muitos dados rapidamente. Assim, é capaz de analisar o conteúdo de um PDF e extrair informações-chave, como momentos específicos de uma conversa ou tópicos relevantes.

Quem pode usar o Google Gemini para ler PDF?

Por enquanto, o Gemini 1.5 com a nova funcionalidade está disponível apenas para a versão Pro, assim como acontece com o ChatGPT, mas está em fase de testes. Os desenvolvedores e clientes corporativos podem experimentar essa nova versão, através do AI Studio ou Vertex AI, mas ainda há limitações.

Não há informações sobre quando ou se o recurso será disponibilizado para usuários do plano gratuito do Gemini.

Usuários do plano Pro do Gemini têm acesso à leitura de livros e documentos em PDF.

Além disso, ainda não é possível fazer upload direto de PDFs na interface do Gemini. Para isso, é preciso integrar o Gemini com outras ferramentas do Google Drive.

Como fazer upload de PDF para Gemini?

O passo a passo para fazer o upload de PDF para o Gemini é o seguinte:

Abra uma página do Google e clique no ícone de "Configurações" (engrenagem) no canto superior direito;
Selecione "Extensões";
Clique em “Descubra mais extensões e temas na Chrome Web Store”
Na barra de pesquisa, procure por “Google Workspace” e ative a extensão;
Na sua conta do Google Drive, clique em "Novo" e selecione "Upload de arquivo";
Escolha o arquivo em PDF que deseja resumir e faça o upload para o Google Drive;
Anote o nome do arquivo, pois será necessário;
Abra o Google Gemini em uma nova guia do navegador.
Clique em "Nova Conversa" para começar;
Se a extensão estiver ativada na sua conta, digite um sinal de adição (+) para exibir todas as extensões disponíveis;
Selecione "Google Drive" para acessar os documentos do Google Drive;
Digite um comando simples seguido do nome do arquivo que você fez upload no Google Drive;
Clique em "Enviar" para enviar o comando.

Como resumir um PDF no Google Gemini?

Para solicitar o resumo de um PDF no Google Gemini os passos são:

Faça o upload do documento no Google Drive e ative a extensão Google Workspace;
Acesse o Google Gemini e clique em "Nova Conversa";
Na conversa, adicione o sinal de adição (+) seguido pelo nome da extensão que deseja usar. Neste caso, selecione "Google Drive";
Digite o comando para resumir o PDF, por exemplo, "Resuma este PDF para mim", seguido do nome do arquivo que você carregou no Google Drive;
Clique em "Enviar" para submeter o comando;
O Google Gemini acessará o documento em PDF no Google Drive e iniciará o processo de resumo;
Após alguns segundos, você receberá um resumo do documento em PDF;
Você pode revisar o resumo fornecido pelo Google Gemini e usar as informações conforme necessário.

Comandos para o Google Gemini para interagir com o PDF

Além de resumos, existem outros comandos que você pode fornecer ao Google Gemini para interagir com o documento em PDF. Veja alguns exemplos:

Gostaria de uma visão geral deste documento em PDF, por favor;
Resuma as principais conclusões deste PDF;
Extraia os pontos-chave deste PDF e resuma-os;
Destaque os tópicos sobre [tema] neste PDF;
Resuma as seções relacionadas a [tema] neste documento;
Enfatize os dados estatísticos presentes neste PDF;
Destaque as citações relevantes deste documento;
Compare os diferentes enfoques mencionados neste PDF e resuma as diferenças;
Contraste os pontos de vista apresentados neste PDF;
Exclua as seções introdutórias e me dê um resumo do conteúdo principal;
Ignore as seções de referência e resuma apenas o conteúdo principal do PDF;
Responda à pergunta “Quais são os principais desafios enfrentados pela [tema]?” com base neste PDF;
Forneça um resumo respondendo à pergunta 'Qual é o impacto das [tema]?' com base neste documento?;
Identifique os casos de estudo mencionados neste PDF e forneça um resumo de cada um deles;
Resuma as recomendações de ação propostas neste documento;
Liste os benefícios discutidos para [tema] neste PDF e resuma-os.

Lembre-se que esses são apenas alguns exemplos de comandos, quanto mais específico você for, melhores serão os resultados obtidos.

Quanto custa o Gemini para ler PDF?

Inicialmente, o Gemini 1.5 será disponibilizado para desenvolvedores e clientes corporativos. Ainda não há uma data definida para o lançamento público na plataforma do Gemini.

A empresa está conduzindo testes de segurança e integridade no Gemini 1.5 e o acesso ao deve ser mediante um preço diferenciado, mas os detalhes específicos sobre os custos ainda não foram divulgados.

Vale apontar que, atualmente, o plano Gemini Advanced, o mais avançado lançado para o público geral, custa R$ 96,99 por mês.

Gostou dessa novidade? Acompanhe o blog da Nord Research para ficar por dentro das atualizações do Google Gemini e outros serviços de inteligência artificial e tecnologia.

Perguntas frequentes

O que é o Google Gemini para ler PDFs?

O Google Gemini para ler PDFs é uma nova funcionalidade que permite a leitura e análise de documentos no formato. A ferramenta pode processar documentos em PDF, analisar seu conteúdo e fornecer respostas e resumos rápidos.

Como faço para fazer upload de um PDF para o Google Gemini?

Para fazer o upload de um PDF para o Google Gemini, você precisa primeiro carregar o documento no Google Drive e, em seguida, utilizar a extensão Google Workspace para acessá-lo através do Google Gemini.

Quem pode utilizar o Google Gemini para ler PDFs?

Atualmente, a funcionalidade está disponível apenas para a versão Pro em fase de testes, destinada a desenvolvedores e clientes corporativos. Ainda não há informações sobre preços ou quando será disponibilizado para o público geral.

Tópicos Relacionados

inteligência artificial