본문 바로가기
개발자 이야기/개발관련

최고의 머신 러닝 기업

by - 하루살이 - 2022. 6. 13.
728x90
반응형

아마존 웹 서비스

2006년에 출시된 Amazon Web Services (AWS)는 클라우드 컴퓨팅의 초기 개척자였으며 계속해서 서비스로서의 인프라(IaaS), 서비스로서의 플랫폼(PaaS) 및 프라이빗 클라우드 서비스의 세계 최대 제공업체입니다. 아마존의 자회사인 이 회사는 2020년 2분기에 108억 달러, 올 상반기까지 210억 달러의 매출을 보고했으며, 분석가들은 이 매출이 클라우드 인프라 시장의 약 3분의 1에 해당한다고 말합니다. 많은 대기업에서 AWS를 사용하여 데이터 중 최소한 일부를 저장하므로 조직에서 ML 공급자를 찾을 때 이점이 있습니다.

Amazon의 기계 학습 서비스 는 주력 SageMaker 서비스 라인을 중심으로 합니다. 여기에는 데이터 세트 관리를 위한 SageMaker Ground Truth 도구, SageMaker Studio IDE, 모델 구축 및 교육을 위한 SageMaker Autopilot, 예측의 인간 검토를 위한 Augmented AI 등이 포함됩니다. 고객은 Intuit, CapitalOne, Siemens, FICO, Kia, Formula1, PWC, Tinder, Yelp, NFL, Netflix 및 Pinterest와 같이 가장 존경받는 기계 학습 사용자입니다.

AWS는 ML을 막 시작한 기업이 2개월 동안 사용할 수 있는 프리 티어를 제공합니다. 그 이후에는 사용된 서비스, 데이터 센터 위치, 인스턴스 크기(사용된 컴퓨팅 리소스 유형) 및 시간에 따라 가격이 결정됩니다. 가격은 모두 사이트에 나열되어 있으며 AWS는 총 비용을 추정하는 도구를 제공합니다.

장점

  • 이미 AWS에 데이터를 저장하거나 다른 AWS 서비스를 사용하는 회사(많은 기업이 이 범주에 해당함)는 기계 학습 요구 사항에도 AWS를 사용하는 것이 편리할 수 있습니다.
  • AWS는 데이터 과학자가 동일한 서비스에서 수행하는 데 필요한 모든 작업을 수행할 수 있도록 하는 올인원 접근 방식을 제공합니다.
  • 선결제 가격을 통해 모든 비용이 얼마인지 알 수 있으며 사용한 만큼만 비용을 지불하면 됩니다.

단점

  • AWS 서비스를 얼마나 사용하고 있는지 계속 확인해야 합니다. 그렇지 않으면 예기치 않게 많은 비용이 청구될 수 있습니다.
  • 일부 고객은 SageMaker에 대한 설명서가 가능한 한 완전하지 않다고 불평합니다.
  • 이 서비스에는 코딩 전문 지식과 고급 데이터 과학 지식이 필요합니다. 일부 다른 ML 공급업체가 제공하는 끌어서 놓기 인터페이스가 없습니다.

데이터브릭

Apache Spark 프로젝트를 지원하는 여러 사람들이 2013년에 설립한 Databricks 는 순수 데이터 과학 및 기계 학습 스타트업입니다. 고객으로는 Comcast, Conde Nast, H&M, Regeneron, Nationwide 및 Showtime이 있습니다. 캘리포니아 샌프란시스코에 본사를 두고 있는 이 회사는 약 8억 9,700만 달러의 자금을 조달했습니다.

Databricks의 통합 데이터 분석 플랫폼 에는 MLflow 기반 데이터 과학 작업 공간, Apache Spark 기반 통합 데이터 서비스, Redash 시각화 및 대시보드 도구가 포함됩니다. AWS 또는 Microsoft Azure에서 실행되며 Tableau, Qlik, Power BI, Looker, Mode, TIBCO Spotfire 및 ThoughtSpot을 비롯한 많은 인기 있는 비즈니스 인텔리전스 도구와 통합됩니다.

이 회사는 AWS 및 Microsoft Azure에 대해 서로 다른 제품을 제공하며 각각 여러 계층으로 제공됩니다. 가격은 회사 웹 사이트에서 확인할 수 있으며 14일 무료 평가판도 사용할 수 있습니다. 더 작은 기능 세트가 포함된 무료 Community Edition도 있습니다.

장점

  • 프로덕션에서 Apache Spark 사용을 고려 중인 경우 Databricks는 기업에 필요한 서비스 및 지원을 통해 Spark의 모든 기능에 액세스할 수 있는 좋은 방법입니다.
  • Python, R 및 Scala를 포함한 여러 언어를 지원합니다.
  • Databricks는 고객 서비스에 대한 극찬을 받았습니다.

단점

  • Databricks는 AWS 또는 Azure 클라우드 인스턴스와 Databricks 서비스에 대해 비용을 지불해야 하기 때문에 어떤 플랜을 선택하느냐에 따라 비용이 많이 들 수 있습니다.
  • 보유한 데이터의 양과 컴퓨팅 인스턴스가 작업에 적합한 크기인지 여부에 따라 서비스가 느려지는 경우가 있습니다.
  • 회사의 문서는 최고가 아니며 검색 기능에서 특히 낮은 점수를 받습니다.

다타이쿠

Anther 데이터 과학 및 머신 러닝 순수 플레이인 Dataiku 는 2013년 프랑스 파리에서 설립되었습니다. 2019년 말, 이 스타트업은 14억 달러의 가치로 "유니콘" 지위를 획득했다고 발표했습니다. 고객으로는 GE, Sephora, Unilever, Ubisoft, Palo Alto Networks, L'Oreal, Capgemini, Les Schwab Tires가 있습니다. 뉴욕, 파리, 런던, 뮌헨, 시드니, 싱가포르에서 400명 이상의 직원을 고용하고 있습니다.

Dataiku DSS 는 협업 및 셀프 서비스 기능을 강조합니다. 노트북과 끌어서 놓기 인터페이스, 시각적 데이터 준비 도구, 모델링 도구 및 대시보드 기능을 모두 통합합니다. 그리고 Python, R, Spark, Scala, Hive 등을 지원합니다.

Dataiku는 Discover, Business 및 Enterprise 버전으로 제공되며 회사는 호스팅된 온라인 평가판 및 무료 버전도 제공합니다. 가격은 요청 시 제공됩니다.

장점

  • Dataiku의 시각적 인터페이스는 다른 많은 기계 학습 도구보다 사용하기 쉽습니다.
  • 플랫폼은 확장성이 뛰어납니다.
  • 워크플로는 매우 유연하며 동일한 프로젝트 내에서 다른 언어를 혼합할 수 있습니다.

단점

  • Dataiku DSS는 다른 기계 학습 옵션만큼 많은 다른 플랫폼과 통합되지 않습니다.
  • 가격을 알아보려면 회사에 문의해야 합니다.
  • 무료 버전은 완전한 기능을 제공하지 않습니다.

구글 클라우드

현재 AWS 및 Microsoft Azure에 이어 세 번째로 큰 클라우드 인프라 제공업체인 Google Cloud 는 G Suite 클라우드 기반 생산성 도구를 포함한 Google의 공용 클라우드 컴퓨팅 서비스입니다. 2020년 2분기에는 전년 동기 대비 43% 증가한 30억 달러의 매출을 올렸습니다. 그 고객으로는 Nintendo, PayPal, Macy's, Spotify, The Home Depot, The New York Times, Toyota, Airbus, FCA, Target 등이 있습니다.

Google Cloud의 기계 학습 서비스 에는 AI Platform, Cloud AutoML, Deep Learning Containers 및 TensorFlow Enterprise가 포함됩니다. 이러한 모든 서비스는 기계 학습 기술의 최대 사용자 중 하나인 Google의 전문 지식과 TensorFlow 및 AutoML에 대한 연구를 활용합니다. CI(지속적 통합), CD(지속적 전달) 및 MLOps 기능을 포함하여 ML 파이프라인의 모든 측면에 대한 서비스를 제공합니다.

다양한 Google 기계 학습 서비스의 가격은 Google Cloud 웹 사이트에서 확인할 수 있으며 다른 클라우드 기계 학습 서비스보다 다소 낮은 경향이 있습니다. Google은 또한 비용을 낮게 유지하는 데 도움이 되는 초당 가격을 제공합니다.

장점

  • Google은 ML 클라우드 서비스에 통합하는 많은 기계 학습 전문 지식을 보유하고 있습니다.
  • 이미 다른 Google Cloud 서비스를 사용하고 있다면 기계 학습 서비스가 매우 편리한 옵션이 될 수 있습니다.
  • Google Cloud는 매우 저렴한 가격을 제공합니다.

단점

  • GCP는 하이브리드 클라우드 모델을 지원하지 않습니다.
  • 일부 사용자는 AutoML 기능이 너무 불투명하고 내부에서 무슨 일이 일어나고 있는지 이해하지 못한다고 불평합니다.
  • Google Cloud의 ML 서비스 중 일부는 시장에 나와 있는 다른 옵션만큼 유연하지 않습니다.

IBM

1911년에 설립된 IBM 은 기술 업계에서 가장 오래되고 존경받는 회사 중 하나입니다. 본사는 뉴욕주 Armonk에 있으며 가장 최근의 분기 보고서에서 181억 달러의 매출을 발표했습니다. IaaS와 SaaS(Software as a Service)를 포함한 전체 분기별 클라우드 매출은 63억 달러였습니다.

인공 지능 및 기계 학습의 초기 개척자 중 하나인 IBM은 Watson AI 플랫폼으로 일찍 헤드라인을 장식했습니다. Watson 브랜드 이름으로 다수의 AI 및 ML 서비스를 계속 판매하고 있습니다. Watson Machine Learning 제품은 다른 Watson 도구와 통합되며 하이브리드 및 다중 클라우드 환경을 지원합니다. 자체 서버에 배포할 수도 있습니다.

IBM은 무료 계층을 포함하여 Watson 서비스에 대해 다양한 가격 옵션을 제공합니다. 종량제 가격 세부 정보는 웹 사이트에서 확인할 수 있지만 구독 가격(종량제보다 낮을 수 있음) 또는 자체 서버에 배포하려면 회사에 문의해야 합니다.

장점

  • IBM의 Watson Machine Learning은 IBM의 클라우드, 다른 클라우드 서비스, 자체 서버 또는 이 세 가지의 조합에 배치할 수 있는 몇 안 되는 ML 서비스 중 하나입니다.
  • IBM은 기업이 ML 프로젝트에서 가치 실현 시간을 단축할 수 있도록 지원하려고 하며 ML 서비스가 생산성을 40%까지 높일 수 있다고 자랑합니다.
  • 이 회사는 오랫동안 AI 업계의 리더였으며 광범위한 관련 서비스 목록을 제공합니다.

단점

  • 일부 고객은 솔루션 배포가 예상보다 오래 걸린다고 불평했습니다.
  • 많은 ML 도구와 마찬가지로 서비스를 최대한 활용하려면 약간의 데이터 과학 전문 지식이 필요합니다.
  • 일부 고객은 자체 서버에 배포할 때 버그가 발생했습니다.

매스웍스

1984년에 설립된 MathWorks 는 매사추세츠 주 내틱에 본사를 둔 비상장 기업입니다. 2019년에는 10억 달러 이상의 매출을 올렸고 400만 명이 넘는 사용자를 보유하고 있습니다. 그 제품은 오랫동안 학계에서 사랑받아 왔으며 고객은 Harvard, MIT, Stanford, Carnegie Mellon 및 기타 여러 명문 대학과 같은 기관을 포함합니다. 또한 보잉, 에어버스, NASA, 포드, GM, 테슬라, 화이자, 노키아, 애플, 인텔, JP 모건, 아마존, 페이스북, 구글을 포함한 기업 사용자의 긴 목록이 있습니다.

원래 1970년대에 만들어진 MATLAB 은 이 목록에서 가장 오래된 제품 중 하나입니다. 다른 대부분은 분석 도구로 시작했지만 MATLAB은 수학자, 과학자 및 엔지니어를 위한 도구로 시작되었습니다. 그러나 고급 수학을 잘 처리하는 동일한 소프트웨어가 기계 학습 알고리즘에도 뛰어난 것으로 나타났습니다. 통계 및 기계 학습 도구 상자와 데이터 과학자에게 매우 유용할 수 있는 딥 러닝 도구 상자가 있습니다.

MathWorks는 MATLAB 30일 무료 평가판을 제공합니다. 그 이후에는 표준 영구 라이선스 비용이 $2,150(또는 연간 $860)입니다. 교육, 가정 및 학생 사용자는 더 저렴한 라이선스 유형을 사용할 수 있습니다. 또한 소프트웨어를 다운로드하거나 온라인 버전을 사용하도록 선택할 수 있습니다.

장점

  • MathWorks의 제품은 학계에서 널리 사용되기 때문에 최근 졸업생과 대학에서 온 데이터 과학자들에게 친숙한 경우가 많습니다.
  • 다른 소프트웨어나 장치에 포함될 기계 학습 코드를 작성하는 데 좋은 옵션입니다.
  • MATLAB은 확장성이 뛰어나고 병렬 처리 기능을 포함합니다.

단점

  • MATLAB은 일반 비즈니스맨이 사용하기 쉽지 않습니다. 수학자, 과학자 및 엔지니어를 위해 설계되었습니다.
  • MathWorks는 종량제 가격을 제공하지 않습니다.
  • MATLAB을 사용하려면 Python 및 R과 같은 다른 인기 있는 언어를 지원하지 않는 MATLAB 언어를 배워야 합니다.

마이크로소프트 애저

2010년에 처음 출시된 Microsoft Azure 는 현재 시장의 약 18%를 차지하는 두 번째로 큰 클라우드 인프라 공급업체입니다. 가장 최근의 분기별 보고에서 Microsoft는 Azure를 포함하는 Intelligent Cloud 그룹이 134억 달러의 수익을 창출했다고 보고했습니다. Azure에 대한 수치는 공개하지 않았지만 Azure 판매가 전년 대비 47% 증가한 것으로 나타났습니다.

Azure의 기계 학습 서비스에는 코드 기반 및 끌어서 놓기 인터페이스는 물론 MLOps에 대한 자동화 및 지원이 모두 포함됩니다. MLflow, Kubeflow, ONNX, PyTorch, TensorFlow, Python 및 R을 포함한 다양한 오픈 소스 도구를 지원합니다. 또한 편향을 감지하고 공정성을 관리하기 위한 도구를 통합합니다.

Azure Machine Learning은 기본 및 엔터프라이즈의 두 가지 버전으로 제공됩니다. 가격은 사용하는 인스턴스 유형에 따라 크게 다르지만 Microsoft는 가격 목록을 게시하고 가격 계산기를 제공합니다. Microsoft는 또한 Machine Learning에 사용할 수 있는 $200 크레딧이 포함된 무료 계정을 제공하며 일부 Cognitive Services는 12개월 동안 무료입니다.

장점

  • Microsoft 서비스는 고급 사용자와 초보자 모두의 요구 사항을 충족하도록 설계되었습니다.
  • 선불 가격 책정을 통해 비용을 정확하게 추정할 수 있으며 일반적으로 매우 저렴합니다.
  • 이 서비스는 다른 Microsoft Azure 서비스를 사용하는 조직에 편리합니다.

단점

  • Azure Machine Learning에는 일부 기업에 필요한 BI 도구 및 기타 애플리케이션에 대한 통합이 부족합니다.
  • 일부 고객은 서비스에 더 많은 R 기반 모델이 있었으면 좋겠다고 말합니다.
  • 주요 클라우드 공급업체의 다른 ML 서비스와 마찬가지로 사용량을 주시하여 예기치 않게 높은 청구액이 발생하지 않도록 해야 합니다.

RapidMiner

2006년에 설립된 RapidMiner 는 비상장 데이터 과학, 인공 지능 및 기계 학습 공급업체입니다. Lufthansa, Transport for London, Daimler, Mobilkom, PayPal 등을 포함하여 40,000명 이상의 고객을 자랑합니다.

RapidMiner 플랫폼에는 Studio, Go, 노트북, AI Hub 및 자동화된 데이터 과학 제품이 포함됩니다. 오픈 소스이자 확장 가능하며 완전한 투명성을 약속합니다. 또한 초보자와 고급 사용자 모두에게 매우 빠른 결과를 제공하는 것을 목표로 합니다.

RapidMiner Studio Free Edition은 제한된 용도로 무료로 사용할 수 있습니다. Professional 버전은 사용자당 연간 $7,500부터 시작하고 엔터프라이즈 버전은 사용자당 연간 $15,000부터 시작합니다. RapidMiner AI Hub의 비용은 연간 $54,000입니다.

장점

  • 사용하기 매우 쉬운 RapidMiner는 데이터 과학 초보자에게 좋은 옵션입니다.
  • 오픈 소스 개발 모델 덕분에 RapidMiner는 뛰어난 투명성을 제공하므로 사용자는 데이터에 무슨 일이 일어나고 있는지 이해할 수 있습니다.
  • 커뮤니티 포럼은 훌륭한 도움을 제공합니다.

단점

  • 도구는 사용 가능한 다른 옵션만큼 유연성을 제공하지 않습니다.
  • 일부 클라우드 공급업체가 제공하는 종량제 가격이 없습니다.
  • 복잡한 모델을 실행하는 사람들은 때때로 버그와 느린 성능을 보고합니다.

SAS

SAS Institute라고도 알려진 SAS 는 세계 최대의 분석 소프트웨어 공급업체 중 하나입니다. 사실, 그것은 모든 종류의 세계에서 가장 큰 비상장 소프트웨어 공급업체입니다. 1976년에 설립된 이 회사는 노스캐롤라이나 주립대학교의 통계 분석 프로그램에서 파생되었으며 현재 노스캐롤라이나주 캐리에 본사가 있습니다. 2019년에 31억 달러의 매출을 보고했으며 현재 약 14,000명의 직원이 있습니다.

많은 SAS 제품이 기계 학습에 도움이 되지만 가장 관련성이 높은 것은 SAS Visual Data Mining 및 기계 학습 소프트웨어일 수 있습니다. 주요 기능에는 자동화된 통찰력 및 해석 가능성, 자동화된 기능 엔지니어링 및 모델링, 자동화된 모델링을 위한 공개 API, 사용하기 쉬운 분석, 네트워크 분석, Python 및 ONNX 지원을 통한 딥 러닝, 통합 데이터 준비 및 인메모리 처리가 포함됩니다. 더 큰 SAS Viya 제품군의 일부입니다.

30일 무료 평가판을 사용할 수 있습니다. 가격은 요청 시 제공됩니다.

장점

  • SAS 솔루션은 시장에서 가장 완전한 기능을 제공하는 솔루션입니다.
  • SAS는 자동화를 광범위하게 활용하여 기계 학습 사용 프로세스를 단순화하고 가치 실현 시간을 단축할 수 있습니다.
  • SAS 소프트웨어는 분석가와 사용자로부터 훌륭한 평가를 받습니다.

단점

  • SAS는 매우 다양한 기계 학습 및 분석 제품을 제공하므로 요구 사항에 적합한 제품을 선택하기 어려울 수 있습니다.
  • 어떤 경우에는 SAS 제품이 경쟁 제품보다 훨씬 더 비쌉니다.
  • 일부 개발자는 SAS 작업이 다른 기계 학습 도구보다 시간이 더 오래 걸린다고 말합니다.

팁코

1997년에 설립된 TIBCO 는 데이터 통합, 데이터 관리 및 분석과 관련된 다양한 소프트웨어 제품을 판매합니다. 고객으로는 Caesars Entertainment, Mercedes-AMG Petronas Formula One Team, Bayer, Blendtec, Campari Group, General Mills, JetBlue, Equifax, Fannie Mae, Macy's, NASA, Panera Bread 및 United Airlines가 있습니다. 캘리포니아 팔로 알토에 본사를 두고 있는 비상장 기업입니다.

TIBCO의 주요 기계 학습 제품은 TIBCO Data Science 입니다. 데이터 준비, 모델 구축, 사전 구축된 템플릿, 버전 제어, 감사 가능성, AutoML, 내장된 Jupyter Notebook 등과 같은 기능을 제공합니다. 또한 일부 ML 기능이 있는 회사의 주력 분석 플랫폼인 TIBCO Spotfire와 통합됩니다.

TIBCO Data Science는 Statistica, AWS용 Team Studio, Students and Academics 에디션의 네 가지 버전으로 제공됩니다. Statistica 및 AWS 버전은 무료 평가판을 제공합니다. 학생 및 학업 버전의 가격은 온라인으로 제공되며 다른 버전의 가격은 요청 시 제공됩니다.

장점

  • TIBCO의 데이터 통합 ​​전문성을 통해 외부 소스에서 데이터를 더 쉽게 가져올 수 있습니다.
  • 이 플랫폼은 또한 우수한 데이터 준비 기능을 갖추고 있습니다.
  • 이 도구는 사용 용이성으로도 좋은 평가를 받습니다.

단점

  • TIBCO 도구는 특히 소규모 조직의 경우 비용이 많이 들 수 있습니다.
  • 일부 고객은 TIBCO가 원하는 만큼 자주 소프트웨어를 업데이트하지 않는다고 말합니다.
  • TIBCO에는 CI/CD 또는 MLOps 기능이 없습니다.

기계 학습 공급업체 비교 표

ML 공급업체

장점

단점

AWS

·    AWS 사용자에게 편리함
·    올인원 접근
·    선불 가격
·    때때로 예기치 않게 높은 청구액이 발생함
·    부실한 문서
·    고급 기술이 필요합니다.
데이터브릭

·   아파치 스파크 기반
·   Python, R 및 Scala 지원
·   우수한 고객 서비스
·   가격이 높을 수 있음
·   성능이 느릴 수 있음
·   빈약한 문서 검색
다타이쿠

·    시각적 인터페이스
·    확장성
·    유연성
·    통합 부족
·    불투명한 가격
·    무료 버전의 제한된 기능
구글 클라우드

·   Google의 ML 전문성
·   Google 사용자에게 편리함
·   저렴한 가격
·   하이브리드 클라우드 지원 없음
·   AutoML 블랙박스
·   유연성 부족
IBM

·    하이브리드 클라우드 및 멀티 클라우드 지원
·    빠른 가치 실현 시간
·    IBM의 AI 전문성
·    배포 속도가 느림
·    데이터 과학 전문성 필요
·    서버 버전 배포 시 버그
매스웍스

·   학계에서 인기
·   임베디드 코드에 적합
·   높은 확장성
·   사용하기 어렵다
·   종량제 요금 없음
·   제한된 언어 지원
마이크로소프트 애저

·    초보자 및 고급 사용자에게 적합
·    낮은 초기 가격
·    Azure 사용자에게 편리함
·    통합 부족
·    더 많은 R 모델 필요
·    때때로 예기치 않게 높은 청구액이 발생함

RapidMiner

·   사용하기 쉬운
·   오픈 소스
·   커뮤니티 포럼
·   유연성 부족
·   종량제 없음
·   복잡한 모델의 버그 및 느린 성능
SAS

·    모든 기능을 갖춘
·    자동화
·    우수한 리뷰
·    혼란스러운 제품 라인업
·    높은 가격
·    느린 성능
팁코

·   손쉬운 데이터 통합
·   우수한 데이터 준비
·   사용 용이성
·    높은 가격
·   비정기적인 업데이트
·   CI/CD 또는 MLOps 없음

 

728x90
반응형

댓글