Edgard Leal

My personal blog hosted on Github using Jekyll

Home View on GitHub
12 October 2015

{:br}[caption id="attachment_102" align="aligncenter" width="223"]R logo R logo[/caption]

Excel vs R - Porque comparar ?

Estas duas ferramentas possuem funcionalidades semelhantes e por isso gera este tipo de questionamento, se são parecidas então não preciso estudar as duas ?! Qual a melhor ? Este tipo de pergunta é aceitável e justificável para ferramentas novas ou que possuem uma grande diferença de "idade". No caso do Excel e do R, talvez seja um pouco diferente porque são duas ferramentas criadas a muito tempo e as duas vem se mantendo firmes no mercado, o Excel como ferramenta fortemente presente em quase todos os ambientes corporativos, e o R como uma ferramenta poderosa na análise de dados. Continue lendo este post que eu espero que lhe auxilie nesta decisão.

A Linguagem R

R é uma linguagem de programação criada para análise de dados e estatística, e tem como uma de suas principais características e o fato de que o software R mantém os dados analisados todos na memória do computador que estiver sendo utilizado no momento, isto faz com que o processamento seja extremamente rápido. O R também possuem recursos que podem lembrar algumas facilidades propiciadas pelo Excel, como poder alterar um grande volume de informação de forma automatizada que é muito útil na análise de dados quando se faz necessário tratar as informações antes da análise. Um ponto muito importante ao para decidir utilizar o R é a sua popularidade, mesmo sendo uma linguagem de programação focada na análise de dados esta na vigésima posição no ranking tiobe que é um ranking de popularidade de todas as principais linguagens de programação, esta popularidade é importante para que o projeto tenha um certa garantia de que será mantido por um longo tempo, além disso faz com que haja uma grande número de pessoas colaborando para o projeto com correções e criações de pacotes de utilitários que somam ate a data de escrita deste post mais de 7000 pacotes de utilitários que incluem ferramentas para buscar informações na internet, criação dos mais diversos tipos de gráficos entre outros muitos.

[caption id="attachment_194" align="aligncenter" width="150"]Excel logo Excel[/caption]

Sobre o Excel

O Excel é um editor de planilhas criado pela Microsoft com uma interface gráfica rica e muitos recursos visuais o que faz com que seja uma ferramenta útil não só para criação e cálculos de planilhas como também uma excelente ferramenta com criar apresentação de dados. O Excel faz parte do pacote Office da Microsoft que pegou uma carona na popularização do Windows e hoje é conhecido por quase todas as pessoas que utilizam um computador no mundo inteiro e é referencia como aplicativo para edição de planilhas, por isso é uma excelente opção quando se pensa em criar um conteúdo de fácil acesso. O Excel ainda possui uma infinidade de recursos gráfico para edição de conteúdo e criação de formulas, este foco em recursos gráficos faz com que seja relativamente fácil de utilizar não requerendo muitos conhecimentos técnicos para começar a tirar proveito dos principais recursos disponibilizados. Toas estas facilidades tem um custo, grande parte dos recursos de hardware ( CPU / Memória ) utilizados pelo Excel são reservados para estes recursos gráficos não sobrando muito para as operações dos os dados, além que é um software proprietário da Microsoft e por isso não tem uma participação ativa de programadores, e por isso é difícil encontrar complementos para funcionalidades muito especificas e quando encontradas são normalmente pagas.

Limitação de linhas por planilha do Excel

Caso você pretenda analisar mas de 1 000 000 de registros, o Excel não será suficiente.

+-----------------+-----------+--------------+---------------------+
|                 | Max. Rows | Max. Columns | Max. Cols by letter |
+-----------------+-----------+--------------+---------------------+
| Excel 365*      | 1,048,576 | 16,384       | XFD                 |
| Excel 2013      | 1,048,576 | 16,384       | XFD                 |
| Excel 2010      | 1,048,576 | 16,384       | XFD                 |
| Excel 2007      | 1,048,576 | 16,384       | XFD                 |
| Excel 2003      | 65,536    | 256          | IV                  |
| Excel 2002 (XP) | 65,536    | 256          | IV                  |
| Excel 2000      | 65,536    | 256          | IV                  |
| Excel 97        | 65,536    | 256          | IV                  |
| Excel 95        | 16,384    | 256          | IV                  |
| Excel 5         | 16,384    | 256          | IV                  |
+-----------------+-----------+--------------+---------------------+

Fonte: http://superuser.com/

Tabela comparativa

Recurso R Excel
 Interface gráfica  Não  Sim
Volume de dados Alto Baixo
Script para automatização Sim Não
Pacotes complementares Muitos Poucos

Conclusão

Como em todo projeto de análise de dados, identifique antes de tudo sua necessidade e objetivos de sua análise, como volume de dados, se o usuário final irá editar o conteúdo final,  e a partir destas informações você poderá decidir onde cada ferramenta será melhor utilizada, desta forma Excel vs R é uma "batalha" desnecessária.

RStudio

É importante lembrar que neste post foi comparado o R "puro", existe uma IDE ( Interface Integrada de Desenvolvimento ) para o R que é o RStudio, que apresenta uma outra infinidade de recursos para trabalhar com o R como criação de documentos/relatórios dinâmicos e slides utilizando linguagem Markdown  que podem ser exportados para HTML e PDF, e quando se tem um bom conhecimento destas ferramentas pode-se desconsiderar as limitações gráficas do R.

Fontes:

{:}{:en}[caption id="attachment_102" align="aligncenter" width="223"]R logo R logo[/caption]

Excel vs R - Why compare?

These two tools have similar functionality and so generates this kind of questioning, whether they are similar so no need to study the two! What is the best ? This type of question is acceptable and justifiable to new tools or have a big difference in "age". In the case of Excel and R, may be a little different because they are two tools created a long time and the two has remained firm in the market, Excel how strongly this tool in most corporate environments, and R as a tool powerful data analysis. Continue reading this post I hope to assist you in this decision.

The R Language

R is a programming language designed for data analysis and statistics, and has as one of its main characteristics and the fact that the R software maintains data analyzed all the computer memory that is currently in use, this causes processing is extremely fast. OR also have features that may remind some facilities offered by Excel, and can change a large amount of information in an automated manner which is very useful in data analysis when it is necessary to treat the information prior to analysis. A very important point when deciding to use the R is its popularity, even being a focused programming language in data analysis is in twentieth position in TIOBE ranking which is a popularity ranking of all major programming languages, this popularity is important for the project to have a certain guarantee that it will be maintained for a long time also means that there is a large number of people contributing to the project with corrections and creations utilities packages that add up to the date of writing this post more than 7,000 utility packages that include tools to search for information on the Internet, creation of all kinds of graphics among many others.

[caption id="attachment_194" align="aligncenter" width="150"]Excel logo Excel[/caption]

About the Excel

Excel is a spreadsheet editor created by Microsoft with a rich graphical interface and many visuals that makes it a useful tool not only for creating spreadsheets and calculations as well as an excellent tool to create presentation data. Excel is part of Microsoft Office package that hitched a ride on the popularity of Windows and is now known to almost everyone who uses a computer in the world and is a reference to application for editing spreadsheets, so it is an excellent option when You are thinking about creating a content easily accessible. Excel also has a multitude of graphic features for editing and content creation formulas, this focus on graphics capabilities makes it relatively easy to use and does not require much technical knowledge to start taking advantage of key features available. But these facilities has a cost, much of the hardware resources (CPU / memory) used by Excel are reserved for these graphics capabilities not much left for the operations of the data, and that is a Microsoft proprietary software and so has not active participation of programmers, and so it's hard to find supplements for very specific features and when found are usually paid.

The limitation of lines in Excel spreadsheet

If you plan to analyze more than 1,000 000 records, Excel will not suffice.

+-----------------+-----------+--------------+---------------------+
|                 | Max. Rows | Max. Columns | Max. Cols by letter |
+-----------------+-----------+--------------+---------------------+
| Excel 365*      | 1,048,576 | 16,384       | XFD                 |
| Excel 2013      | 1,048,576 | 16,384       | XFD                 |
| Excel 2010      | 1,048,576 | 16,384       | XFD                 |
| Excel 2007      | 1,048,576 | 16,384       | XFD                 |
| Excel 2003      | 65,536    | 256          | IV                  |
| Excel 2002 (XP) | 65,536    | 256          | IV                  |
| Excel 2000      | 65,536    | 256          | IV                  |
| Excel 97        | 65,536    | 256          | IV                  |
| Excel 95        | 16,384    | 256          | IV                  |
| Excel 5         | 16,384    | 256          | IV                  |
+-----------------+-----------+--------------+---------------------+

Source: http://superuser.com/

Comparative table

Resource R Excel
 Graphic Interface  No  Yes
Data volume Hight Low
Script for automation Yes No
Complementary packages Many Few

Conclusion

 As in all data analysis project, identify first of all your needs and goals of your analysis, how much data, if the end user will edit the final content, and from this information you can decide where each tool is best used thus Excel vs R is a unnecessary "battle".

Extra - RStudio

Please note that this post was compared AR "pure", there is an IDE interface (Integrated Development) for R which is the RStudio, which presents another multitude of features for working with R as document creation / dynamic reports and slides using Markdown language that can be exported to HTML and PDF, and when you have a good knowledge of these tools can disregard the graphical limitations of the R.

Sources:

{:}



blog comments powered by Disqus