Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.
產品簡介
生成速度更快的程式碼—速度更快
功能
•	 開發速度更快的程式碼。提升當前及下一代處理器上的應用性能。
•	 更快地編寫程式碼。使用工具箱,更加簡便地生成快速、可靠的並行程式碼。
•	 包括高性能編譯器、庫、並行模型、執行序及向量化顧...
英特爾® Parallel Studio XE 2016
英特爾 Parallel Studio XE 版本
英特爾® Parallel Studio XE 有三種版本。請選擇滿足您的開發需求的版本。
版本 功能 組件
設計版
使用行業領先的編...
3	 英特爾® Parallel Studio XE 2016
組件 詳細信息
Fortran 編譯器
英特爾® Fortran 編譯器
•	 行業領先的 Fortran 應用性能
•	 廣泛支持 Fortran 標準、OpenMP 等
•	 ...
英特爾® Parallel Studio XE 2016
組件 詳細信息
數學庫
英特爾® 數學內核庫
•	 最快、最常用的數學庫,適用於英特爾及兼容的處理器
•	 預先高度調諧,在新舊處理器以及未來處理器產品上均可提供最佳性能
•	 簡單程式...
5	 英特爾® Parallel Studio XE 2016
專業版
編譯版中的所有功能另加以下功能:
•	 新型資料分析加速庫,支持更快的大資料處理
•	 高級性能和執行序分析器,用於調優應用性能及多核可擴展性
•	 向量化和執行序顧問,只...
英特爾® Parallel Studio XE 2016
組件 詳細信息
記憶體和執行序調試器
英特爾® Inspector XE
•	 快速查找記憶體漏洞和記憶體分配錯誤
•	 定位不容易查找的執行序錯誤,例如資料爭用和死鎖
•	 檢測未經許...
7	 英特爾® Parallel Studio XE 2016
組件 詳細信息
MPI 調諧和分析
英特爾® 追踪分析器和收集器
•	 分析 MPI 應用,快速查找瓶頸,實現並行集群應用的高性能
•	 通過 MPI 性能快照對大型 MPI 任務...
本文提供的信息與英特爾®產品密切相關。沒有獲得本文檔的知識產權授權,無法獲得明示或暗示、代理或者其它方式的許可。除相關產品的英特爾銷售條款與條件中列明之擔保條件以外,英特爾公
司不對銷售和/或使用英特爾產品做出其它任何明確或隱含的擔保,包括對適...
Prochain SlideShare
Chargement dans…5
×

生成速度更快的程式碼—速度更快 - Intel Parallel Studio XE 2016

1 319 vues

Publié le

功能

• 開發速度更快的程式碼。提升當前及下一代處理器上的應用性能。
• 更快地編寫程式碼。使用工具箱,更加簡便地生成快速、可靠的並行程式碼。
• 包括高性能編譯器、庫、並行模型、執行序及向量化顧問模塊、記憶體/執行序調試器、分析器等。

新增功能

• 同時採用向量化和執行序技術快速編碼。向量化顧問模塊提供工具和訣竅,可在幾天內有效實現向量化,而不需要幾個月的時間。
• 通過使用英特爾®資料分析加速庫(英特爾® DAAL)產品,加快資料分析和機器學習程序的速度。
• 使用 MPI 性能快照更快地解析 MPI 任務(達到至少 32000 行列),提高集群性能。
• 以及更多功能……

英特爾® Parallel Studio XE 2016

英特爾軟體開發工具

您需要讓應用更快地運行。您的軟件執行大資料分析、醫學影像、時間至關重要的財務分析、模擬(例如CFD、天氣等)或者數千種宜早不宜遲的任務之一。您已經在使用現有的開發工具(例如GNU、XCode* 或 Visual Studio*),這些工具在Linux*、OS X* 和 Windows*上運行。

您所需要的是一套工具,該工具要能夠與現有的工作方式兼容,並且更加簡便地加快程式碼執行。英特爾® Parallel Studio XE是一套高性能工具,它利用英特爾®至強®處理器和英特爾®至強融核™處理器中不斷增長的內核數及廣泛的向量寄存器,提高應用速度。

購買請洽 祺荃企業有限公司-您可以信賴的軟體供應商
www.cheerchain.com.tw or www.appcenter.com.tw
Email : info@cheerchain.com.tw Phone : +8864-23863559

Publié dans : Logiciels
  • You can hardly find a student who enjoys writing a college papers. Among all the other tasks they get assigned in college, writing essays is one of the most difficult assignments. Fortunately for students, there are many offers nowadays which help to make this process easier. The best service which can help you is ⇒ www.HelpWriting.net ⇐
       Répondre 
    Voulez-vous vraiment ?  Oui  Non
    Votre message apparaîtra ici

生成速度更快的程式碼—速度更快 - Intel Parallel Studio XE 2016

  1. 1. 產品簡介 生成速度更快的程式碼—速度更快 功能 • 開發速度更快的程式碼。提升當前及下一代處理器上的應用性能。 • 更快地編寫程式碼。使用工具箱,更加簡便地生成快速、可靠的並行程式碼。 • 包括高性能編譯器、庫、並行模型、執行序及向量化顧問模塊、記憶體/執行序調試 器、分析器等。 新增功能 • 同時採用向量化和執行序技術快速編碼。向量化顧問模塊提供工具和訣竅,可在幾 天內有效實現向量化,而不需要幾個月的時間。 • 通過使用英特爾®資料分析加速庫(英特爾® DAAL)產品,加快資料分析和機器學習 程序的速度。 • 使用 MPI 性能快照更快地解析 MPI 任務(達到至少 32000 行列),提高集群性能。 • 以及更多功能…… 英特爾® Parallel Studio XE 2016 英特爾軟體開發工具 您需要讓應用更快地運行。您的軟件執行大資料分析、醫學影像、時間至關重要的財務分 析、模擬(例如CFD、天氣等)或者數千種宜早不宜遲的任務之一。您已經在使用現有的開 發工具(例如GNU、XCode* 或 Visual Studio*),這些工具在Linux*、OS X* 和 Windows* 上運行。 您所需要的是一套工具,該工具要能夠與現有的工作方式兼容,並且更加簡便地加快程式 碼執行。英特爾® Parallel Studio XE是一套高性能工具,它利用英特爾®至強®處理器和英 特爾®至強融核™處理器中不斷增長的內核數及廣泛的向量寄存器,提高應用速度。
  2. 2. 英特爾® Parallel Studio XE 2016 英特爾 Parallel Studio XE 版本 英特爾® Parallel Studio XE 有三種版本。請選擇滿足您的開發需求的版本。 版本 功能 組件 設計版 使用行業領先的編譯器和庫(包括新型資料分 析庫)構建快速程式碼 C++ 以及/或 Fortran* 編譯器、性能庫和並 行模型 專業版 增加分析工具 設計版另加性能分析器、向量化優化和執行序 原型設計、記憶體及執行序調試器 集群版 增加 MPI 集群工具 專業版另加 MPI 集群通信庫以及 MPI 錯誤 檢查和調諧 包括一年產品支持和更新服務 購買產品,您可以獲得最新的更新和發布版本與支持服務,並且支持舊版本。它還針對您的產品問題提供私人、直接和有求必應的答 覆,讓您獲得通過論壇等用戶社區和自助式文檔庫積累形成的數十年的產品專業經驗。 設計版 • 通過使用行業領先的 C++ 和 Fortran 編譯器重新編譯,獲得更好的性能。 • 通過內置直觀的並行模型和向量化支持,簡化並行機制的添加。 • 為您的程式碼帶來針對最新硬體優化的高級庫。 組件 詳細信息 C/C++ 編譯器 英特爾® C++ 編譯器 • 行業領先的 C++ 應用性能 • 與常用的編譯器、開發環境和操作系統兼容 • 通過基於標準的並行機制模型(包括 OpenMP*)簡化開發 1.30 1.51 1.24 1.51 使用英特爾C++編譯器 提升Windows和Linux上的C++應用性能 (越高越好) Windows Linux Windows Linux 預估SPECfp®_rate_base2006 預估SPECint®_rate_base2006 VisualC++ 2015 英特爾16.0 英特爾16.0 英特爾C++ 16.0 英特爾C++ 16.0 VisualC++ 2015 GCC 5.2.0 GCC 5.2.0 浮點 整數 相對幾何平均值性能,SPEC*速率基準 1 11 1 配置:Windows 硬體:HP DL320e第8代 第2版(單接口服務器),配置英特爾至強CPU E3- 1280 第3版@ 3.60GHz,32 GB RAM,超執行序關閉;Linux 硬體:HP BL460c 第9代,配置英特爾至強CPU E5-2680 第3版@ 2.50GHz,256 GB RAM,超執行序 開啟。軟體:英特爾C++編譯器16.0,Microsoft C/C++優化編譯器版本19.00.23026,適用於x86/x64,GCC 5.2.0。Linux OS:Red Hat Enterprise Linux Server 7.1版本(Maipo),內核3.10.0-229.el7.x86_64。Windows OS:Windows 8.1。SPEC基準(www.spec. org)。
  3. 3. 3 英特爾® Parallel Studio XE 2016 組件 詳細信息 Fortran 編譯器 英特爾® Fortran 編譯器 • 行業領先的 Fortran 應用性能 • 廣泛支持 Fortran 標準、OpenMP 等 • 與領先的開發環境和編譯器兼容 使用英特爾Fortran編譯器 提升Windows和Linux上的Fortran應用性能 (越高越好) 相對幾何平均值性能,Polyhedron*基準 1.001.00 1.07 1.33 1.09 1.88 1.32 1.64 Absoft* 15.0.1 PGI Fortran 15.3 PGI Fortran 15.3 Open64* 4.5.2 Absoft* 15.0.1 英特爾Fortran16.0 英特爾Fortran16.0 Windows Linux gFortran* 5.1.0 配置:硬體:英特爾酷睿 i7-4770K CPU @ 3.50GHz,超執行序關閉,16 GB RAM。軟體:英特爾Fortran編譯器16.0,Absoft 15.0.1,.PGI Fortran* 15.3,Open64 4.5.2,gFortran 5.1.0。Linux OS:Red Hat Enterprise Linux Server 7.0版本(Maipo),内核 3.10.0-123.el7.x86_64。Windows OS:Windows 7,Service pack 1。Windows*編譯器開關:Absoft: -m64-O5-speed_ math=10-fast_math-march=core-xINTEGER-stack:0x80000000。英特爾Fortran編譯器:/fast/Qparallel/link/ stack:64000000。PGI Fortran: -fastsse-Munroll=n:4-Mipa=fast, inline-Mconcur=numa。Linux編譯器開關:Absoft-m64- mavx-O5-speed_math=10-march=core-Xinteger。Gfortran: -Ofast-mfpmath=sse-flto-march=native-funroll-loops-ftree- parallelize-loops=4。英特爾Fortran編譯器:-fast-parallel。PGI Fortran: -fast-Mipa=fast, inline-Msmartalloc-Mfprelaxed- Mstack_arrays-Mconcur=bind。Open64:-march=bdver1-mavx-mno-fma4-Ofast-mso-apo。Polyhedron Fortran基準(www. fortran.uk)。. 資料分析和機器學習庫 英特爾® 資料分析加速庫(英特爾® DAAL) • 使用方便易用的庫,提升大資料分析和機器學習性能 • 為各種採用英特爾架構的設備交付高應用性能 • 通過資料和環境集成加速獲得回報 • 通過豐富多樣、預先優化的高級分析算法縮短應用開發時間 與Spark MLLib相比, 使用英特爾DAAL提升線性回歸性能 4倍 6倍 6倍 7倍 7倍 0 2 4 6 8 1M ×200 1M ×400 1M ×600 1M ×800 1M ×1000 加速 表大小 配置:版本:英特爾爾數據分析加速庫2016,CDH 5.3.1版,Apache Spark 1.2.0版;硬體:英特爾至強處理器E5-2699 第3版,2個 18核CPU(45MB LLC,2.3GHz),每個節點256GB的RAM;操作系統:CentOS 6.6 x86_64。線性回歸(DAAL NormEq方法對比 MLLib 8迭代),基於英特爾至強處理器E5-2697 第3版在8節點Hadoop集群上運行。 設計版(續)
  4. 4. 英特爾® Parallel Studio XE 2016 組件 詳細信息 數學庫 英特爾® 數學內核庫 • 最快、最常用的數學庫,適用於英特爾及兼容的處理器 • 預先高度調諧,在新舊處理器以及未來處理器產品上均可提供最佳性能 • 簡單程式碼集成的實際標準 API 0 500 1000 1500 256 300 450 800 1000 1500 2000 3000 4000 5000 6000 7000 8000 性能(GFlops) 矩陣大小(M=N) 英特爾®至強®處理器E5-2699第3版 英特爾MKL – 1執行序 英特爾MKL – 18執行序 英特爾MKL – 36執行序 ATLAS – 1執行序 ATLAS – 18執行序 ATLAS – 36執行序 與ATLAS*相比, 使用英特爾MKL提升DGEMM性能 (越高越好) 配置:版本:英特爾數學內核庫(英特爾MKL)11.3,ATLAS 3.10.2;硬體:英特爾至強處理器E5-2699 第3版,2個18核CPU(45MB LLC,2.3GHz),64GB的RAM;英特爾酷睿處理器i7-4770K,四核CPU(8MB LLC,3.5GHz),8GB的RAM;操作系統:RHEL 6.4 GA x86_64。 用於媒體和資料應用的算法構建模塊 英特爾® 集成性能基元 • 預先優化的構建模塊,提供就緒的多核支持,包括計算密集的功能,幫助進行大型資料集問題 處理和高性能計算 • 廣泛的域支持,包括映像/信號處理、資料壓縮、加密和字符串處理 • 跨平台支持,針對當前及未來的處理器進行了優化 執行序庫 英特爾® 執行序構建模塊 • 廣泛使用的 C++ 模板庫,支持任務並行機制 • 擁有高級並行算法和並發容器以及低級構建模塊,例如可擴展的記憶體分配算符、鎖、原子操 作等 • 以高效、可擴展的方式利用多核處理器的強大功能 • 與多種編譯器兼容,可遷移至各種操作系統 基於標準的並行模型 英特爾® OpenMP • 性能驅動的 OpenMP 4.0 實施以及 4.1 初步支持 • 支持英特爾® SSE 和 AVX 簡化並行模型 英特爾® Cilk™ Plus • 簡化性能並行機制的添加,只需三個關鍵詞即可完成 • 面向未來擴展,運行時系統可在具有數百內核的系統上平滑運行 • 向量化和執行序化,在所有英特爾®和兼容處理器上提供最高性能 Fortran 數值分析 Rogue Wave IMSL* 庫 • 為 Fortran 應用提供數值分析功能,包括一組全面的數學和統計算法,多達 1000 多種 • 以附加組件形式提供,適用於任何 Fortran 套件(包括在設計版本中) 設計版(續)
  5. 5. 5 英特爾® Parallel Studio XE 2016 專業版 編譯版中的所有功能另加以下功能: • 新型資料分析加速庫,支持更快的大資料處理 • 高級性能和執行序分析器,用於調優應用性能及多核可擴展性 • 向量化和執行序顧問,只需幾天時間即可實現向量化和高效執行序化,而不需要幾個月的時間 • 記憶體和執行序調試器,可輕鬆識別記憶體漏洞和記憶體分配錯誤 組件 詳細信息 性能分析器 英特爾® VTune™ Amplifier XE • 收集豐富的資料,對 CPU 和 GPU 計算性能、多核擴展性、OpenMP、帶寬等進行調優 • 對結果進行分類、篩选和可視化,以便快速洞察性能瓶頸 • 使用功能強大的命令行自動進行回歸測試,遠程收集資料 向量化優化和執行序原型設計 英特爾® Advisor XE • 由兩種工具組成:向量化顧問和執行序顧問 • 通過向量化和執行序技術獲得更多程式碼性能 • 只需幾天時間即可實現向量化和高效執行序化,而不需要幾個月的時間 • 記憶體訪問模式、循環-承載依賴性以及行程計數分析 • 設計、調優和檢查執行序,無需中斷正常開發進程
  6. 6. 英特爾® Parallel Studio XE 2016 組件 詳細信息 記憶體和執行序調試器 英特爾® Inspector XE • 快速查找記憶體漏洞和記憶體分配錯誤 • 定位不容易查找的執行序錯誤,例如資料爭用和死鎖 • 檢測未經許可的訪問和懸擺指針 集群版 專業版中的所有功能另加以下功能: • 加快基於英特爾®架構集群上的應用性能,具有多種結構的靈活性 • 分析 MPI 應用,快速查找瓶頸,實現並行集群應用的高性 組件 詳細信息 消息傳遞接口庫 英特爾® MPI 庫 • 使應用在基於英特爾架構的集群上更好地執行,具有多種結構的靈活性 • 性能優化的 MPI 庫 • 保持可擴展性,低時延,高帶寬,增加進程數 • 全面混合支持多核及眾核系統 採用英特爾MPI庫5.1交付卓越性能 1792個進程,64個節點(InfiniBank + 共享内存), Linux 64相對(幾何平均值)MPI時延基準(越高越好) 3.6 3.6 4.3 5.2 4.7 1 1 1 1 1 1.70 2.42 3.18 3.66 4.12 0 1 2 3 4 5 6 4字節 512字節 16千字節 128千字節 512千字節 英特爾MPI 5.1 MVAPICH2 2.1 OpenMPI 1.8.5 64個節點速度 提高5.2倍 加速(时间) 配置:硬體:CPU:雙英特爾至強E5-2697 第3版@2.60GHz;64 GB RAM。互聯組件:Mellanox Technologies MT27500系列 [ConnectX*-3]。軟體:RHEL6.5;OFED 3.5-2;英特爾®C/C++編譯器 XE 15.0.3;英特爾®MPI庫5.1;英特爾®MPI基準4.1。 專業版(續)
  7. 7. 7 英特爾® Parallel Studio XE 2016 組件 詳細信息 MPI 調諧和分析 英特爾® 追踪分析器和收集器 • 分析 MPI 應用,快速查找瓶頸,實現並行集群應用的高性能 • 通過 MPI 性能快照對大型 MPI 任務(多達 32000 隊列)進行快速性能分析 • 可擴展,低開銷,有效可視化 • 靈活契合工作流:編譯、鏈接或運行 集群版(續)
  8. 8. 本文提供的信息與英特爾®產品密切相關。沒有獲得本文檔的知識產權授權,無法獲得明示或暗示、代理或者其它方式的許可。除相關產品的英特爾銷售條款與條件中列明之擔保條件以外,英特爾公 司不對銷售和/或使用英特爾產品做出其它任何明確或隱含的擔保,包括對適用於特定用途、適銷性,或不侵犯任何專利、版權或其它知識產權的擔保。除非由英特爾採用書面形式另行商定,英特爾產 品並非專門針對任何應用設計而成,英特爾產品故障可能會造成人身傷害或死亡的情況。 性能測試中使用的軟體和工作負載可能已經針對僅英特爾微處理器上的性能進行了優化。諸如 SYSmark 和 MobileMark 等性能測試使用特定計算機系統、組件、軟體、操作和功能進行測評。這些因 素的任何變化均可能導致結果發生改變。應當諮詢其他信息和性能測試,以便全面評估預期採購,包括該產品與其他產品組合使用的性能。基準資料來源:英特爾公司。 優化通知:對於非英特爾特有的微處理器,英特爾的編譯器或許能實現同等程度的非英特爾微處理器優化,或許不能實現。這些優化包括 SSE2、SSE3 和 SSSE3 指令集等。英特爾不保證非由英特爾 生產的微處理器上任何優化的可用性、功能性或有效性。在本產品中,依賴微處理器的優化與英特爾微處理器配套實現。某些非英特爾微架構特定優化則為英特爾微處理器預留。請參閱適用的產品《 用戶和參考指南》,了解有關本通知所涵蓋特定指令集的更多信息。通知修訂編號:#20110804。 英特爾有權隨時更改產品的規格和描述而毋需發出通知。設計者不應信賴任何英特爾產品所不具有的特性,設計者亦不應信賴任何標有“保留權利”或“未定義”說明或特性描述。英特爾保留今後對其定 義的權利,對於因今後對其進行修改所產生的衝突或不兼容性概不負責。此處提供的信息可隨時改變而毋需通知。請勿使用本信息來對某個設計做出最終決定。 所述產品和服務可能包含缺陷或錯誤(“勘誤表”),這可能導致與已發布規範出現偏離。一經要求,可提供具備最新表徵的勘誤表。聯繫您的當地英特爾銷售辦事處或經銷商,在發出產品訂單之前獲取 最新的技術規格。若要索取本文檔中附有訂單號或提及的文檔副本或者其它英特爾資料,可以撥打電話:1-800-548-4752,或者訪問英特爾網站:www.intel.com。 © 2015, 英特爾公司。版權所有。英特爾和英特爾標識是英特爾公司在美國以及/或其他國家和地區的商標。*其他名稱和品牌可能屬於其他各自所有。 美國印刷 請循環使用 Intel-Parallel-Studio-XE-2016-PB-EN/Rev081715 英特爾® Parallel Studio XE 2016 8 要了解詳細信息以及下載免費試用30天的評估產品,請點擊: intel.ly/parallel-studio-xe 設計版 1 專業版 1 集群版 英特爾® C++ 編譯器 ü ü ü 英特爾® Fortran 編譯器 ü ü ü 英特爾® 資料分析加速庫 ü ü ü 英特爾® 執行序構建模塊(僅適用於 C++) ü ü ü 英特爾® 集成性能基元(僅適用於 C++) ü ü ü 英特爾® 數學內核庫 ü ü ü 英特爾® Cilk™ Plus (僅適用於 C++) ü ü ü 英特爾® OpenMP* ü ü ü Rogue Wave IMSL* 庫2 (僅適用於 Fortran) 捆綁和附加 附加 附加 英特爾® Advisor XE ü ü 英特爾® Inspector XE ü ü 英特爾® VTune Amplifier XE3 ü ü 英特爾® MPI 庫3 ü 英特爾® 追踪分析器和收集器 ü 操作系統 (開發環境) Windows (Visual Studio), Linux (GNU), OS X4 (XCode) Windows (Visual Studio), Linux (GNU) Windows (Visual Studio), Linux (GNU) 注: 1. 可提供單一語言(C++ 或 Fortran)或雙語言版本。 2. 可作為任何 Windows Fortran* 套件的附加組件,或者與某種編譯版的版本捆綁。 3. 捆綁在套件中或單獨提供。 4. 以 OS X 上運行的單一語言套件形式提供。 規格概覽 處理器 支持多代英特爾和兼容處理器,包括但不限於:英特爾酷睿™處理器、英特爾至強處理器及英特爾至強融核™協 處理器 語言 兼容 Microsoft、GCC、Intel.C、C++、C#、Fortran、Java*、ASM 等編譯器 操作系統 Windows、Linux 和 OS X(OS X開發者可以在編譯器版的 C++ 或 Fortran 版本之间選擇) 開發環境 Windows: 集成到 Microsoft Visual Studio* 之中 Linux: 兼容 GNU 工具 OS X: XCode 其它信息 www.intel.com/software/products/systemrequirements/ 英特爾® Parallel Studio XE 包括:

×