O que é extração de dados?
A extração de dados é a técnica que auxilia na extração das informações desejadas de uma página da web em HTML para um arquivo local presente em sua máquina local. Normalmente, um arquivo local pode corresponder a um arquivo do Excel, arquivo do Word ou, digamos, qualquer aplicativo do Microsoft Office. Ele ajuda a canalizar informações críticas da página da web.
A coleta de dados se torna simples ao trabalhar em um projeto baseado em pesquisa diariamente, e tal projeto depende puramente da Internet e do site. Para ilustrar melhor o assunto, tomemos o exemplo de um day trader que executa uma macro do Excel para extrair informações de mercado de um site de finanças em uma planilha do Excel usando o VBA.
Neste tutorial, você aprenderá:
- O que é extração de dados?
- Como preparar a macro do Excel antes de executar a extração de dados usando o Internet explorer?
- Como abrir o Internet Explorer usando o Excel VBA?
- Como abrir um site no Internet Explorer usando o VBA?
- Como raspar informações de um site usando o VBA?
Como preparar a macro do Excel antes de executar a extração de dados usando o Internet explorer?
Existem certos pré-requisitos que devem ser executados no arquivo de macro do Excel antes de entrar no processo de extração de dados no Excel.
Esses pré-requisitos são os seguintes: -
Etapa 1) Abra uma macro baseada em Excel e acesse a opção de desenvolvedor do Excel.
Etapa 2) Selecione a opção Visual Basic na faixa de opções Desenvolvedor.
Etapa 3) Insira um novo módulo.
Etapa 4) Inicializar uma nova sub-rotina
Sub test()End sub
O módulo resultaria da seguinte forma: -
Etapa 5) Acesse a opção de referência na guia de ferramentas e consulte a Biblioteca de objetos HTML da Microsoft e o controle da Internet da Microsoft.
Os arquivos a seguir devem ser referenciados para o módulo, pois ajuda a abrir o Internet Explorer e facilita o desenvolvimento de scripts de macro.
Agora o arquivo Excel está pronto para interagir com o Internet Explorer. A próxima etapa seria incorporar scripts de macro que facilitariam a coleta de dados em HTML.
Como abrir o Internet Explorer usando o Excel VBA?
Etapa 1) Inicializar a variável nas sub-rotinas conforme exibido abaixo
Sub test()Dim ie As New InternetExplorerDim doc As New HTMLDocument
Passo 2) Para abrir o Internet Explorer usando VBA, escreva ie visible = true e pressione F5.
Sub test()Dim ie As New InternetExplorerDim doc As New HTMLDocumentIe.visible=true
O módulo seria o seguinte: -
Como abrir um site no Internet Explorer usando o VBA?
Aqui estão as etapas para abrir o site no explorador de Internet usando VBA
Etapa 1) Uma vez que você consiga acessar o Internet Explorer usando Excel VBA, a próxima etapa seria incorporar o acesso a um site usando VBA. Isso é facilitado por Navigate Attribute, em que a URL deve passar como aspas duplas no atributo. Siga as etapas a seguir conforme exibido.
Sub test()Dim, ie As New InternetExplorerDim doc As New HTMLDocumentDim ecoll As Objectie.Visible = Trueie.navigate"http://demo.guru99.com/test/web-table-element.php"DoDoEventsLoop Until ie.readyState = READYSTATE_COMPLETE
Etapa 2) - Pressione F5 para executar a macro. A seguinte página da web seria aberta conforme exibida
Agora, a macro do Excel está pronta para executar as funções de raspagem. A próxima etapa seria mostrar como as informações podem ser extraídas do Internet Explorer usando o VBA.
Como raspar informações de um site usando o VBA?
Suponha que o day trader queira acessar os dados do site diariamente. Cada vez que o day trader pressiona o botão, ele deve automaticamente puxar os dados de mercado para o Excel.
No site acima, seria necessário inspecionar um elemento e observar como os dados estão estruturados.
Etapa 1) Acesse o código-fonte HTML abaixo pressionando control + Shift + I
Company | Group | Pre Close (Rs) | Current Price (Rs) | % Change |
---|