ศูนย์กลางการ เคลื่อนไหว ค่าเฉลี่ย กรอง
เมื่อคำนวณค่าเฉลี่ยเคลื่อนที่ที่ใช้งานอยู่การวางค่าเฉลี่ยในช่วงเวลากลางหมายความว่าในตัวอย่างก่อนหน้านี้เราคำนวณค่าเฉลี่ยของช่วงเวลา 3 ช่วงแรกและวางไว้ข้างงวด 3 เราสามารถวางค่าเฉลี่ยในช่วงกลางของ ช่วงเวลาสามช่วงคือถัดจากช่วงเวลา 2 ซึ่งทำงานได้ดีกับช่วงเวลาแปลก ๆ แต่ไม่ค่อยดีเท่าช่วงเวลาที่เท่ากัน เราจะวางค่าเฉลี่ยเคลื่อนที่ครั้งแรกเมื่อ M 4 ในทางเทคนิคค่า Moving Average จะลดลงที่ 2.5, 3.5 เพื่อหลีกเลี่ยงปัญหานี้เราจะทำให้ MAs เรียบขึ้นโดยใช้ M 2. ดังนั้นเราจึงเรียบค่าที่ราบเรียบถ้าเราเฉลี่ยจำนวนที่เท่ากันของเงื่อนไขเราต้องเรียบค่าที่ราบรื่นตารางต่อไปนี้แสดงผลลัพธ์โดยใช้ M 4. ค่าเฉลี่ยเคลื่อนที่ค่าเฉลี่ยเคลื่อนที่โดยทั่วไป datasets ค่าเฉลี่ยมักจะเป็นครั้งแรกและเป็นหนึ่งในประโยชน์มากที่สุดสถิติสรุปในการคำนวณ เมื่อข้อมูลอยู่ในรูปแบบของชุดเวลาซีรี่ส์หมายถึงการวัดที่เป็นประโยชน์ แต่ไม่ได้สะท้อนถึงลักษณะพลวัตของข้อมูล ค่าเฉลี่ยที่คำนวณจากช่วงสั้น ๆ ก่อนหน้าช่วงเวลาปัจจุบันหรือตรงกลางของช่วงเวลาปัจจุบันมักมีประโยชน์มากกว่า เนื่องจากค่าเฉลี่ยดังกล่าวจะแปรผันหรือเคลื่อนย้ายเนื่องจากระยะเวลาปัจจุบันจะเคลื่อนที่จากเวลา t 2, t 3 เป็นต้นเรียกว่าค่าเฉลี่ยเคลื่อนที่ (Mas) ค่าเฉลี่ยเคลื่อนที่โดยเฉลี่ยคือ (โดยปกติ) ค่าเฉลี่ยที่ไม่มีการถัวเฉลี่ยของค่าก่อนหน้า k ค่าเฉลี่ยเคลื่อนที่แบบถ่วงน้ำหนักแบบเลขยกกำลังเป็นหลักเหมือนกับค่าเฉลี่ยเคลื่อนที่โดยเฉลี่ย แต่มีส่วนร่วมกับค่าเฉลี่ยที่ถ่วงน้ำหนักโดยความใกล้ชิดกับเวลาปัจจุบัน เนื่องจากไม่มีตัวอักษร แต่เป็นชุดค่าเฉลี่ยเคลื่อนที่ทั้งหมดสำหรับชุดใดก็ตามชุดของ Mas สามารถถูกจัดวางลงบนกราฟวิเคราะห์เป็นชุดและใช้ในการสร้างแบบจำลองและการคาดการณ์ ช่วงของแบบจำลองสามารถสร้างโดยใช้ค่าเฉลี่ยเคลื่อนที่และเป็นที่รู้จักในรูปแบบ MA ถ้าโมเดลดังกล่าวรวมกับโมเดลอัตถิภาวนิยม (AR) รูปแบบคอมโพสิตที่เป็นที่รู้จักกันในชื่อ ARMA หรือ ARIMA (แบบบูรณาการ) ค่าเฉลี่ยเคลื่อนที่ที่เรียบง่ายเนื่องจากชุดเวลาสามารถถือได้ว่าเป็นชุดของค่า, t 1,2,3,4, n ค่าเฉลี่ยของค่าเหล่านี้สามารถคำนวณได้ ถ้าเราคิดว่า n มีขนาดใหญ่มากและเราเลือกจำนวนเต็ม k ซึ่งน้อยกว่า n เราสามารถคำนวณชุดค่าเฉลี่ยบล็อกหรือค่าเฉลี่ยเคลื่อนที่ที่สั้น ๆ (ของคำสั่ง k): แต่ละค่าจะแสดงค่าเฉลี่ยของค่าข้อมูลในช่วงเวลาสังเกตการณ์ k โปรดทราบว่า MA ที่เป็นไปได้ครั้งแรกของคำสั่ง k GT0 คือสำหรับ t k โดยทั่วไปเราสามารถลด subscript พิเศษในนิพจน์ด้านบนและเขียนได้: ค่านี้ระบุว่าค่าเฉลี่ยที่เวลา t เป็นค่าเฉลี่ยที่ง่ายของค่าที่สังเกตได้ ณ เวลา t และขั้นตอน k-1 ก่อนหน้า ถ้าใช้น้ำหนักที่ลดการมีส่วนร่วมของการสังเกตที่ไกลออกไปในเวลาค่าเฉลี่ยเคลื่อนที่จะกล่าวได้ว่าเป็นแบบเรียบ ค่าเฉลี่ยเคลื่อนที่มักใช้เป็นรูปแบบของการคาดการณ์โดยที่ค่าประมาณสำหรับชุดในเวลา t 1, S t1 ถูกนำมาเป็น MA สำหรับระยะเวลาถึงและรวมถึงเวลา t เช่น. การประมาณในปัจจุบันคำนวณจากค่าเฉลี่ยที่บันทึกไว้ก่อนหน้านี้และรวมถึงวันวาน (สำหรับข้อมูลรายวัน) ค่าเฉลี่ยเคลื่อนที่ที่เรียบง่ายสามารถเห็นได้ว่าเป็นรูปแบบการทำให้เรียบ ในตัวอย่างที่แสดงด้านล่างชุดข้อมูลมลพิษทางอากาศที่แสดงในบทนำสู่หัวข้อนี้ได้รับการเพิ่มขึ้นโดยเส้นค่าเฉลี่ยเคลื่อนที่ 7 วัน (MA) ซึ่งแสดงเป็นสีแดง ที่สามารถมองเห็นได้สาย MA ช่วยให้จุดสูงสุดและร่องในข้อมูลเป็นไปอย่างราบรื่นและเป็นประโยชน์ในการระบุแนวโน้ม สูตรคำนวณการคำนวณล่วงหน้าหมายถึงจุดข้อมูล k -1 จุดแรกไม่มีค่า MA แต่หลังจากนั้นการคำนวณจะขยายไปยังจุดข้อมูลสุดท้ายในชุดข้อมูล ค่าเฉลี่ยของวัน PM10 แหล่งที่มาของ Greenwich: London Air Quality Network, londonair. org. uk เหตุผลหนึ่งในการคำนวณค่าเฉลี่ยเคลื่อนที่แบบง่ายๆในลักษณะที่อธิบายไว้คือค่าที่คำนวณได้สำหรับช่วงเวลาทั้งหมดตั้งแต่เวลา tk ขึ้นไปจนถึงปัจจุบันและ เป็นวัดใหม่ที่ได้รับสำหรับเวลา t 1, MA สำหรับเวลา t 1 สามารถเพิ่มไปยังชุดที่คำนวณแล้ว นี่เป็นขั้นตอนง่ายๆสำหรับชุดข้อมูลแบบไดนามิก อย่างไรก็ตามมีบางประเด็นเกี่ยวกับแนวทางนี้ มีเหตุผลที่จะยืนยันว่าค่าเฉลี่ยในช่วง 3 ช่วงสุดท้ายกล่าวคือควรตั้งอยู่ที่เวลา t -1 ไม่ใช่เวลา t และสำหรับ MA มากกว่าจำนวนคู่ของระยะเวลาบางทีมันควรจะอยู่ที่จุดกึ่งกลางระหว่างสองช่วงเวลา การแก้ปัญหานี้คือการใช้การคำนวณ MA ซึ่งอยู่ตรงกลางซึ่ง MA ในเวลา t เป็นค่าเฉลี่ยของชุดสมมาตรของค่ารอบ t แม้จะมีประโยชน์อย่างเห็นได้ชัด แต่วิธีนี้ใช้ไม่ได้โดยทั่วไปเนื่องจากต้องการข้อมูลที่พร้อมใช้งานสำหรับเหตุการณ์ในอนาคตซึ่งอาจจะไม่ใช่กรณีนี้ ในกรณีที่การวิเคราะห์ทั้งหมดเป็นชุดที่มีอยู่การใช้ Mas ไว้ตรงกลางอาจเป็นที่นิยมกว่า ค่าเฉลี่ยเคลื่อนที่ที่เรียบง่ายอาจถือได้ว่าเป็นรูปแบบหนึ่งของการปรับให้เรียบลบองค์ประกอบความถี่สูงบางส่วนของชุดเวลาและเน้นแนวโน้ม (แต่ไม่ลบ) ในลักษณะเดียวกันกับแนวคิดทั่วไปของการกรองแบบดิจิทัล แท้จริงค่าเฉลี่ยเคลื่อนที่คือรูปแบบของตัวกรองเชิงเส้น คุณสามารถใช้การคำนวณค่าเฉลี่ยเคลื่อนที่เป็นชุดที่ได้รับการปรับให้เรียบขึ้นแล้วเช่นการปรับให้เรียบหรือกรองชุดที่เรียบขึ้นไปแล้ว ตัวอย่างเช่นมีค่าเฉลี่ยเคลื่อนที่ของลำดับที่ 2 เราสามารถพิจารณาว่าคำนวณโดยใช้น้ำหนักดังนั้น MA ที่ x 2 0.5 x 1 0.5 x 2 ในทำนองเดียวกัน MA ที่ x 3 0.5 x 2 0.5 x 3 ถ้าเรา เราใช้ 0.5 x 2 0.5 x 3 0.5 (0.5 x 1 0.5 x 2) 0.5 (0.5 x 2 0.5 x 3) 0.25 x 1 0.5 x 2 0.25 x 3 เช่นการกรองแบบ 2 ขั้นตอน กระบวนการ (หรือ convolution) ได้สร้างค่าเฉลี่ยเคลื่อนที่แบบสมมาตรที่มีการถ่วงน้ำหนักที่มีการเปลี่ยนแปลงโดยมีน้ำหนัก หลาย convolutions สามารถผลิตค่าเฉลี่ยเคลื่อนที่ถ่วงน้ำหนักค่อนข้างซับซ้อนซึ่งบางส่วนมีการใช้งานเฉพาะในสาขาพิเศษเช่นในการคำนวณการประกันชีวิต ค่าเฉลี่ยเคลื่อนที่สามารถใช้ในการลบเอฟเฟ็กต์เป็นระยะ ๆ หากคำนวณด้วยระยะเวลาเป็นระยะ ๆ ตามที่ทราบ ตัวอย่างเช่นเมื่อมีข้อมูลรายเดือนข้อมูลตามฤดูกาลสามารถเปลี่ยนแปลงได้โดยการใช้ค่าเฉลี่ยเคลื่อนที่ 12 เดือนที่สมมาตรกับทุกเดือนที่มีการถ่วงน้ำหนักอย่างเท่าเทียมกันยกเว้นกรณีที่ 1 และครั้งสุดท้ายที่มีการถ่วงน้ำหนักด้วย 12 เนื่องจากมี เป็นเวลา 13 เดือนในรูปแบบสมมาตร (ปัจจุบัน, t. - 6 เดือน) ทั้งหมดถูกแบ่งโดย 12 ขั้นตอนที่คล้ายกันสามารถนำมาใช้สำหรับระยะเวลาที่กำหนดไว้อย่างชัดเจน ค่าเฉลี่ยเคลื่อนที่ที่ถ่วงน้ำหนัก (Expedential Weighted Moving Average - EWMA) โดยใช้สูตรค่าเฉลี่ยเคลื่อนที่แบบง่ายๆ: การสังเกตทั้งหมดมีการถ่วงน้ำหนักอย่างเท่าเทียมกัน ถ้าเราเรียกว่าน้ำหนักเท่ากันนี้อัลฟา t แต่ละ k น้ำหนักจะเท่ากับ 1 k ดังนั้นผลรวมของน้ำหนักจะเป็น 1 และสูตรจะเป็น: เราได้เห็นแล้วว่าการใช้งานหลายขั้นตอนนี้ส่งผลให้น้ำหนักที่แตกต่างกัน ด้วยค่าเฉลี่ยเคลื่อนที่ที่ถ่วงน้ำหนักแบบยกกำลังให้ความสำคัญกับค่าเฉลี่ยจากการสังเกตการณ์ที่ถูกลบออกไปในเวลามากขึ้นจะลดลงด้วยเหตุนี้จึงเน้นเหตุการณ์ที่เกิดขึ้นเมื่อเร็ว ๆ นี้ โดยทั่วไปจะมีการปรับค่าพารามิเตอร์การทำให้ราบเรียบ alpha lt1 เป็น 0lt และสูตรจะได้รับการแก้ไขเพื่อให้: สูตรสมมาตรของสูตรนี้จะมีรูปแบบดังนี้: ถ้าน้ำหนักในรูปแบบสมมาตรถูกเลือกให้เป็นเงื่อนไขของข้อกำหนดของการขยายตัวแบบสองส่วน (1212) 2q พวกเขาจะรวมกันเป็น 1 และเมื่อ q กลายเป็นขนาดใหญ่จะใกล้เคียงกับการแจกแจงแบบปกติ นี่คือรูปแบบของการถ่วงน้ำหนักของเคอร์เนลโดยมีฟังก์ชัน Binomial ทำหน้าที่เป็นฟังก์ชันเคอร์เนล การแกว่งสองขั้นตอนที่อธิบายไว้ในหมวดย่อยก่อนหน้านี้คือการจัดเรียงนี้อย่างแม่นยำด้วย q 1 ซึ่งให้น้ำหนัก ในการทำให้เรียบเรียบขึ้นจำเป็นต้องใช้ชุดของน้ำหนักที่รวมกันเป็น 1 และลดขนาดทางเรขาคณิต น้ำหนักที่ใช้มีรูปแบบดังนี้: เพื่อแสดงให้เห็นว่าน้ำหนักเหล่านี้รวมกันเป็น 1 ให้พิจารณาการขยายตัวเป็น 1 เป็นชุด เราสามารถเขียนและขยายนิพจน์ในวงเล็บโดยใช้สูตรทวินาม (1- x) p. โดยที่ x (1-) และ p -1 ซึ่งจะให้: ค่านี้จะให้รูปแบบของค่าเฉลี่ยเคลื่อนที่ที่ถ่วงน้ำหนักของแบบฟอร์ม: ผลรวมนี้สามารถเขียนเป็นความสัมพันธ์ที่เกิดซ้ำได้ซึ่งช่วยลดความซับซ้อนในการคำนวณและหลีกเลี่ยงปัญหาที่ระบบการถ่วงน้ำหนัก ควรมีความยาวไม่ จำกัด สำหรับน้ำหนักที่จะรวมกันเป็น 1 (สำหรับค่าอัลฟ่าเล็กน้อยนี่ไม่ใช่กรณีปกติ) สัญกรณ์ที่ใช้โดยผู้เขียนที่แตกต่างกันจะแตกต่างกันออกไป บางคนใช้ตัวอักษร S เพื่อระบุว่าสูตรนั้นเป็นตัวแปรที่ราบรื่นและเขียนว่า: ในขณะที่ทฤษฎีวรรณคดีควบคุมมักใช้ Z แทน S สำหรับค่าที่ถ่วงน้ำหนักหรือเรียบเรียงเป็นพหุคูณ (ดูตัวอย่างเช่น Lucas and Saccucci, 1990, LUC1 , และเว็บไซต์ NIST สำหรับรายละเอียดเพิ่มเติมและตัวอย่างการทำงาน) สูตรที่อ้างถึงข้างต้นมาจากผลงานของ Roberts (1959, ROB1) แต่ Hunter (1986, HUN1) ใช้การแสดงออกของรูปแบบ: ซึ่งอาจเหมาะสมกว่าสำหรับการใช้ในขั้นตอนการควบคุมบางอย่าง ด้วยค่า alpha 1 ค่าประมาณเฉลี่ยคือค่าที่วัดได้ (หรือมูลค่าของรายการข้อมูลก่อนหน้า) ด้วยค่าประมาณ 0.5 ค่าเฉลี่ยของค่าเฉลี่ยเคลื่อนที่ของการวัดในปัจจุบันและก่อนหน้า ในรูปแบบการคาดการณ์ S t. มักใช้เป็นประมาณการหรือค่าพยากรณ์ในช่วงเวลาต่อไปนั่นคือค่าประมาณสำหรับ x ณ เวลา t ดังนั้นเราจึงได้แสดงให้เห็นว่าค่าพยากรณ์ที่ t 1 เป็นค่าเฉลี่ยเคลื่อนที่แบบถ่วงน้ำหนักแบบ บวกกับส่วนประกอบที่แสดงถึงข้อผิดพลาดในการทำนายถ่วงน้ำหนักเอปไซลอน เวลา t สมมติว่ามีชุดเวลาและต้องมีการคาดการณ์ค่าอัลฟาต้อง นี้สามารถประมาณจากข้อมูลที่มีอยู่โดยการประเมินผลรวมของข้อผิดพลาดการทำนายกำลังสองได้รับกับค่าที่แตกต่างของ alpha สำหรับแต่ละ t 2,3 การตั้งค่าการประมาณครั้งแรกเป็นค่าข้อมูลที่สังเกตครั้งแรก x 1. ในแอ็พพลิเคชันควบคุมค่าของอัลฟามีความสำคัญในการใช้ในการกำหนดขีด จำกัด การควบคุมด้านบนและด้านล่างและมีผลต่อระยะเวลาในการทำงานโดยเฉลี่ย (ARL) ก่อนที่ข้อ จำกัด ในการควบคุมเหล่านี้จะเสีย (ภายใต้สมมติฐานว่าชุดข้อมูลเวลาเป็นชุดของตัวแปรอิสระแบบสุ่มที่แจกแจงแบบเดียวกันโดยมีความแปรปรวนร่วมกัน) ภายใต้สถานการณ์เช่นนี้ความแปรปรวนของสถิติการควบคุม: คือ (ลูคัสและ Saccucci, 1990): ขีด จำกัด ของการควบคุมมักจะตั้งค่าเป็นทวีคูณที่คงที่ของความแปรปรวนของการไม่ทำงานนี้เช่น - ค่าเบี่ยงเบนมาตรฐาน 3 เท่า ถ้าตัวอย่างเช่น alpha 0.25 และข้อมูลที่ได้รับการตรวจสอบจะถือว่ามีการแจกแจงแบบปกติ N (0,1) เมื่ออยู่ในการควบคุมขีด จำกัด ของการควบคุมจะเป็น - 1.134 และกระบวนการนี้จะถึงหนึ่งหรือขีด จำกัด อื่น ๆ ใน 500 ขั้นตอน โดยเฉลี่ย. Lucas และ Saccucci (1990 LUC1) ได้รับค่า ARLs สำหรับค่า alpha และภายใต้สมมติฐานต่างๆโดยใช้กระบวนการ Markov Chain พวกเขาจัดทำเป็นตารางผลลัพธ์รวมถึงการให้ ARLs เมื่อค่าเฉลี่ยของกระบวนการควบคุมได้รับการเปลี่ยนแปลงโดยค่าเบี่ยงเบนมาตรฐานหลายค่าหลายค่า ตัวอย่างเช่นเมื่อมีการเปลี่ยนแปลง 0.5 กับ alpha 0.25 ค่า ARL จะน้อยกว่า 50 ขั้นตอนเวลา วิธีการที่อธิบายข้างต้นเป็นที่รู้จักกันในชื่อเดียวเรียบ เป็นขั้นตอนที่ใช้ครั้งเดียวกับชุดเวลาและจากนั้นการวิเคราะห์หรือการควบคุมกระบวนการจะดำเนินการในชุดข้อมูลที่เกิดเรียบ หากชุดข้อมูลมีส่วนประกอบของเทรนด์ตามฤดูกาลหรืออาจใช้การทำให้เรียบแบบทวีคูณแบบสองขั้นตอนหรือสามขั้นตอนเพื่อใช้เป็นแนวทางในการลบลักษณะเหล่านี้ (ดูเพิ่มเติมที่ส่วนการพยากรณ์อากาศด้านล่างและตัวอย่างการทำงานของ NIST) CHA1 Chatfield C (1975) การวิเคราะห์ไทม์ซีรี่ส์: ทฤษฎีและการปฏิบัติ แชปแมนและฮอลล์, ลอนดอน HUN1 เธ่อเจเอส (1986) ค่าเฉลี่ยถ่วงน้ำหนักแบบเลขยกกำลัง J ของ Quality Technology, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) แผนการควบคุมค่าเฉลี่ยเคลื่อนที่ที่ถ่วงน้ำหนักแบบทวีคูณ: คุณสมบัติและการปรับปรุง Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) การควบคุมแผนภูมิการทดสอบขึ้นอยู่กับค่าเฉลี่ยเคลื่อนที่ทางเรขาคณิต Technometrics, 1, 239-2505.2 Smoothing Time Series Smoothing มักจะทำเพื่อช่วยให้เราดูรูปแบบแนวโน้มเช่นในชุดข้อมูลได้ดียิ่งขึ้น โดยทั่วๆไปจะทำให้เกิดความขรุขระไม่สม่ำเสมอเพื่อให้เห็นสัญญาณที่ชัดเจนขึ้น สำหรับข้อมูลตามฤดูกาลเราอาจปรับฤดูกาลตามฤดูกาลเพื่อให้เราสามารถระบุแนวโน้มได้ Smoothing ไม่ได้ให้แบบจำลอง แต่อาจเป็นขั้นตอนแรกที่ดีในการอธิบายคอมโพเนนต์ต่างๆของชุด ตัวกรองคำบางครั้งใช้เพื่ออธิบายขั้นตอนการทำให้ราบรื่น ตัวอย่างเช่นถ้าค่าที่ราบรื่นสำหรับเวลาหนึ่ง ๆ ถูกคำนวณเป็นชุดค่าผสมเชิงเส้นของการสังเกตสำหรับรอบเวลาอาจกล่าวได้ว่าเราใช้ตัวกรองเชิงเส้นกับข้อมูล (ไม่เหมือนกับการบอกว่าผลลัพธ์เป็นเส้นตรงด้วย ทาง) การใช้ค่าเฉลี่ยเคลื่อนที่ระยะยาวแบบเดิมคือในแต่ละจุดที่เรากำหนดค่าเฉลี่ยของค่าที่สังเกตได้รอบ ๆ ช่วงเวลาโดยเฉพาะ (อาจจะถ่วงน้ำหนัก) ตัวอย่างเช่นในเวลา t ค่าเฉลี่ยเคลื่อนที่ที่ศูนย์กลางของความยาว 3 ที่มีน้ำหนักเท่ากับจะเป็นค่าเฉลี่ยของค่าในช่วง t -1 t และ t1 หากต้องการลดฤดูกาลออกจากซีรีส์เพื่อให้เราสามารถมองเห็นแนวโน้มได้ดีขึ้นเราจะใช้ค่าเฉลี่ยเคลื่อนที่ที่มีช่วงเวลายาวนาน ดังนั้นในชุดที่ราบเรียบแต่ละค่าที่ราบเรียบได้รับการเฉลี่ยในทุกฤดูกาล ซึ่งอาจทำได้โดยการดูค่าเฉลี่ยเคลื่อนที่แบบด้านเดียวซึ่งคุณจะเฉลี่ยค่าทั้งหมดสำหรับข้อมูลปีก่อน ๆ ที่มีค่าหรือเป็นค่าเฉลี่ยเคลื่อนที่ที่ศูนย์กลางซึ่งคุณใช้ค่าทั้งก่อนและหลังเวลาปัจจุบัน สำหรับข้อมูลรายไตรมาสเช่นเราสามารถกำหนดค่าที่ราบรื่นสำหรับเวลา t เป็น (x t x t -1 x t-2 x t-3) 4 ซึ่งเป็นค่าเฉลี่ยของเวลานี้และ 3 ไตรมาสก่อนหน้า ในโค้ด R รหัสนี้จะเป็นตัวกรองแบบด้านเดียว ค่าเฉลี่ยเคลื่อนที่ที่ศูนย์กลางทำให้เกิดความยากลำบากเมื่อเรามีจำนวนช่วงเวลาในช่วงเวลาตามฤดูกาล (เช่นที่เรามักทำ) เพื่อให้เป็นไปตามฤดูกาลในข้อมูลรายไตรมาส เพื่อระบุแนวโน้มการประชุมตามปกติคือการใช้ค่าเฉลี่ยเคลื่อนที่ที่เรียบในเวลา t คือการทำให้เป็นไปตามฤดูกาลในข้อมูลรายเดือน เพื่อที่จะระบุแนวโน้มการประชุมตามปกติคือการใช้ค่าเฉลี่ยเคลื่อนที่ที่เรียบในเวลา t คือนั่นคือเราใช้น้ำหนัก 124 กับค่าในเวลา t6 และ t6 และน้ำหนัก 112 ถึงค่าทั้งหมดตลอดเวลาระหว่าง t5 และ t5 ในคำสั่งกรอง R ให้ระบุตัวกรองสองหน้าให้ดีเมื่อเราต้องการใช้ค่าที่มาทั้งก่อนและหลังการปรับให้เรียบ โปรดทราบว่าในหน้า 71 หนังสือของเราผู้เขียนใช้น้ำหนักที่เท่ากันทั่วทั้งค่าเฉลี่ยเคลื่อนที่ตามฤดูกาล ที่ถูกเกินไป ตัวอย่างเช่นราบเรียบรายไตรมาสอาจจะเรียบในเวลา t เป็นเดือนที่นุ่มนวลอาจใช้น้ำหนัก 113 กับค่าทั้งหมดจากครั้ง t-6 ถึง t6. รหัสที่ผู้เขียนใช้ในหน้า 72 ใช้ประโยชน์จากคำสั่ง rep ที่ทำซ้ำค่าเป็นจำนวนครั้งที่กำหนด พวกเขาไม่ได้ใช้พารามิเตอร์ตัวกรองภายในคำสั่ง filter ตัวอย่างที่ 1 การผลิตเบียร์รายไตรมาสในประเทศออสเตรเลียในบทที่ 1 และบทที่ 4 เราได้ศึกษาการผลิตเบียร์เป็นรายไตรมาสในออสเตรเลีย โค้ด R ต่อไปนี้สร้างชุดข้อมูลที่ราบรื่นขึ้นเพื่อให้เราเห็นรูปแบบแนวโน้มและวางแผนรูปแบบแนวโน้มนี้ในกราฟเดียวกับชุดข้อมูลเวลา คำสั่งที่สองจะสร้างและเก็บชุดที่ราบรื่นไว้ในวัตถุที่เรียกว่า trendpattern โปรดสังเกตว่าในตัวกรองคำสั่งพารามิเตอร์ที่ชื่อว่าตัวกรองจะให้ค่าสัมประสิทธิ์สำหรับการทำให้เรียบและด้านข้างของเรา 2 ทำให้มีการคำนวณค่าความเรียบที่ศูนย์กลาง beerprod scan (beerprod. dat) ตัวกรอง trendpattern (beerprod, ตัวกรอง c (18, 14, 14, 18), sides2) พล็อต (beerprod, type b, แนวโน้มการเคลื่อนที่โดยเฉลี่ยรายปีหลัก) เส้น (trendpattern) นี่คือผลลัพธ์: เรา อาจลบรูปแบบแนวโน้มออกจากค่าข้อมูลเพื่อดูลักษณะตามฤดูกาลได้ดีขึ้น นี่คือวิธีการที่จะทำได้: seasonals beerprod - แนวโน้ม plotpattern (seasonals, ชนิด b, หลักตามฤดูกาลสำหรับการผลิตเบียร์) ผลดังนี้: ความเป็นไปได้อื่น ๆ สำหรับการเรียบชุดเพื่อดูแนวโน้มเป็นตัวกรองฟิลเตอร์ตัวกรองด้านเดียว (beerprod, filter c (14, 14, 14, 14) ด้าน 1) ด้วยเหตุนี้ค่าที่เรียบจะเป็นค่าเฉลี่ยของปีที่ผ่านมา ตัวอย่างที่ 2 การว่างงานรายเดือนในสหรัฐอเมริกาในการทำการบ้านสัปดาห์ที่ 4 คุณได้ดูตัวเลขการว่างงานในสหรัฐฯประจำเดือนสำหรับปีพ. ศ. 2491-2517 นี่คือการปรับให้เรียบเพื่อดูแนวโน้ม (trendunemploy, maintrend in U. S. Unemployment, 1948-1978, xlab Year) เฉพาะแนวโน้มที่ราบรื่นถูกวางแผนไว้ (2) แนวโน้มการไหลเวียนโลหิต คำสั่งที่สองจะระบุลักษณะของเวลาตามปฏิทินของชุดข้อมูล ที่ทำให้พล็อตมีแกนที่มีความหมายมากขึ้น พล็อตดังต่อไปนี้ สำหรับซีรี่ส์ที่ไม่ได้ใช้ตามฤดูกาลคุณไม่ต้องพึ่งพาช่วงเวลาใด ๆ สำหรับการทำให้เรียบคุณควรทดสอบกับค่าเฉลี่ยเคลื่อนที่ของช่วงเวลาที่แตกต่างกัน ระยะเวลาดังกล่าวอาจสั้นลง มีวัตถุประสงค์เพื่อขจัดขอบหยาบเพื่อดูแนวโน้มหรือรูปแบบที่อาจมีอยู่ Other Smoothing Methods (มาตรา 2.4) ส่วนที่ 2.4 อธิบายทางเลือกที่ซับซ้อนและมีประโยชน์มากมายสำหรับการปรับให้เรียบโดยเฉลี่ย รายละเอียดอาจดูไม่สมบูรณ์ แต่ไม่เป็นไรเพราะเราไม่ต้องการรับรายละเอียดมากเกินไปสำหรับวิธีการเหล่านี้ จากวิธีการอื่นที่ได้อธิบายไว้ในส่วน 2.4 อาจมีการใช้ lowess (การถดถอยถ่วงน้ำหนักแบบถ่วงน้ำหนักในประเทศ) อย่างกว้างขวางที่สุด ตัวอย่างที่ 2 ต่อเนื่องพล็อตต่อไปนี้เป็นเส้นแนวโน้มที่เรียบสำหรับชุดการว่างงานในสหรัฐฯซึ่งพบว่าใช้ lowess เรียบกว่าซึ่งเป็นจำนวนมาก (23) มีส่วนทำให้การคาดการณ์เรียบแต่ละครั้ง โปรดทราบว่าสิ่งนี้ทำให้ชุดมีความขันสูงกว่าค่าเฉลี่ยเคลื่อนที่ คำสั่งที่ใช้คือการว่างงาน (การว่างงาน, เริ่มต้น c (1948,1), freq12) พล็อต (lowess (การว่างงาน, f 23), Lowess หลักของการทำให้ราบรื่นของการว่างงานในสหรัฐ) Single Exponential Smoothing สมการพยากรณ์พื้นฐานสำหรับการเรียบง่ายแบบทวีคูณ เราคาดว่าค่าของ x ในเวลา t1 จะเป็นค่าที่รวมถ่วงน้ำหนักของค่าที่สังเกตได้ ณ เวลา t และค่าพยากรณ์ที่เวลา t แม้ว่าวิธีการนี้จะเรียกว่าวิธีการปรับให้เรียบ (smoothing method) ซึ่งใช้เป็นหลักในการคาดการณ์ระยะสั้น ค่าของเรียกว่าการปรับให้ราบเรียบ ด้วยเหตุผลใด 0.2 เป็นทางเลือกที่นิยมเริ่มต้นของโปรแกรม นี่ทำให้น้ำหนักของ. 2 ในการสังเกตการณ์ล่าสุดและน้ำหนัก 1 .2 .8 ในการคาดการณ์ล่าสุด มีค่าค่อนข้างน้อยการทำให้ราบเรียบจะค่อนข้างกว้างขึ้น ด้วยค่าที่ค่อนข้างใหญ่การทำให้ราบเรียบนั้นค่อนข้างน้อยลงเมื่อน้ำหนักมากขึ้นจะทำให้ค่าที่สังเกตได้ นี่คือวิธีการคาดการณ์ล่วงหน้าที่ง่ายกว่าหนึ่งขั้นตอนที่เห็นได้ชัดก่อนว่าไม่ได้ต้องการแบบจำลองสำหรับข้อมูล ในความเป็นจริงวิธีนี้เทียบเท่ากับการใช้รูปแบบ ARIMA (0,1,1) โดยไม่มีค่าคงที่ ขั้นตอนที่เหมาะสมที่สุดคือให้พอดีกับรูปแบบ ARIMA (0,1,1) กับชุดข้อมูลที่สังเกตได้และใช้ผลลัพธ์เพื่อหาค่าของ นี่เป็นวิธีที่ดีที่สุดในแง่ของการสร้างสิ่งที่ดีที่สุดสำหรับข้อมูลที่ได้สังเกตมาแล้ว แม้ว่าเป้าหมายจะราบเรียบและการคาดการณ์ล่วงหน้าหนึ่งก้าวความเท่าเทียมกันของรูปแบบ ARIMA (0.1,1) จะนำมาซึ่งจุดดีขึ้น เราไม่ควรสุ่มสี่สุ่มห้าใช้การทำให้เรียบตามที่ระบุเนื่องจากกระบวนการอ้างอิงอาจไม่ได้รับการสร้างแบบจำลองโดย ARIMA (0,1,1) ARIMA (0,1,1) และ Exponential Smoothing Equivalence พิจารณาอาร์เรย์ (0,1,1) ด้วยค่าเฉลี่ย 0 สำหรับความแตกต่างแรก xt - x t-1: เริ่มต้น amp amp amp amp xt theta1 wt amp amp xt theta1 (xt สิ่งที่ t) amp amp (1 theta1) xt - theta1 มีแนวโน้ม ถ้าเราปล่อยให้ (1 1) และดังนั้น - (1) 1 เราจะเห็นความเท่าเทียมกันของสมการ (1) ข้างต้น ทำไมถึงเรียกวิธีนี้ว่า Exponential Smoothing นี่จะให้ผลลัพธ์ต่อไปนี้: เริ่ม amp amp amp amp alpha xt (อัลฟา 1 alpha x alpha alpha x 1 alpha alpha xt alpha 1 alpha) ในรูปแบบนี้โดยการแทนที่อย่างต่อเนื่องสำหรับค่าที่คาดการณ์ไว้ทางด้านขวาของสมการ สิ่งนี้นำไปสู่: alpha alpha (1 alpha) x alpha (1-alpha) 2 x จุด alpha (1-alpha) jx alpha alpha (1-alpha) x1 text สมการ 2 แสดงให้เห็นว่าค่าพยากรณ์ที่คาดว่าจะเป็นค่าเฉลี่ยถ่วงน้ำหนัก ของค่าที่ผ่านมาทั้งหมดของซีรีส์ด้วยการเปลี่ยนน้ำหนักอย่างมากในขณะที่เราย้ายกลับมาอยู่ในซีรีส์ การเพิ่มประสิทธิภาพ Exponential ที่เหมาะสมที่สุดใน R โดยพื้นฐานแล้วเราเพียงแค่ใส่ข้อมูล ARIMA (0,1,1) และกำหนดค่าสัมประสิทธิ์ เราสามารถตรวจสอบพอดีของราบรื่นโดยการเปรียบเทียบค่าที่คาดการณ์ไว้กับชุดจริง การเพิ่มความลื่นไหลชี้แจงมีแนวโน้มที่จะถูกนำมาใช้เป็นเครื่องมือในการคาดการณ์มากกว่าความเรียบลื่นจริงดังนั้นเราจึงต้องการดูว่าเรามีความเหมาะสมหรือไม่ ตัวอย่างที่ 3 n การสังเกตการณ์รายเดือน 100 ลอการิทึมของดัชนีราคาน้ำมันในสหรัฐอเมริกา ชุดข้อมูลคือ ARIMA (0.1,1) พอดีใน R ให้ค่าสัมประสิทธิ์ (0.3877) ของ MA (1) ดังนั้น (1 1) 1.3877 และ 1- -0.3877 สมการพยากรณ์ความเรียบของการเสวนาคือหมวก 1.3877xt - 0.3877hat t เวลา 100 ค่าที่สังเกตได้ของชุดคือ x 100 0.86601 ค่าที่คาดการณ์ไว้สำหรับซีรีส์ในเวลานั้นคือดังนั้นการคาดการณ์เวลา 101 คือหมวก 1.3877x - 0.3877 วินาที 1.3877 (0.86601) -0.3877 (0.856789) 0.8696 ต่อไปนี้เป็นวิธีการที่เรียบเนียนขึ้นกับชุดข้อมูล มันพอดี เป็นสัญญาณที่ดีสำหรับการคาดการณ์จุดประสงค์หลักสำหรับเรื่องนี้ที่นุ่มนวลขึ้น นี่คือคำสั่งที่ใช้ในการสร้างเอาท์พุทสำหรับตัวอย่างนี้: พล็อตการสแกน oilindex (oildata. dat) (oilindex, b, log หลักของดัชนีดัชนีน้ำมัน) expsmoothfit arima (oilindex, order c (0,1,1)) expsmoothfit เพื่อดูผลลัพธ์ของ Arima ที่คาดการณ์ค่าการจัดเตรียมน้ำมัน (oilindex, typeb, Exponential Smoothing หลักของ Log of Oil Index) เส้น (คาดการณ์) 1.3877oilindex100-0.3877predicteds100 การคาดการณ์สำหรับเวลา 101 Double Exponential Smoothing การปรับความเปรียบเปรยแบบทวีคูณสองครั้งอาจใช้เมื่อเอาเปรียบ แนวโน้ม (ระยะยาวหรือระยะสั้น) แต่ไม่มีฤดูกาล โดยพื้นฐานแล้ววิธีการนี้จะสร้างการคาดการณ์โดยการรวมการประมาณค่าของแนวโน้ม (ความลาดเอียงของเส้นตรง) และระดับ (โดยทั่วไปการสกัดเส้นตรง) ใช้น้ำหนักหรือน้ำหนักที่ต่างกันสองแบบเพื่อปรับปรุงส่วนประกอบทั้งสองนี้ในแต่ละครั้ง ระดับที่ราบรื่นมากหรือน้อยเท่ากับการเรียบอย่างเรียบง่ายของค่าข้อมูลและแนวโน้มที่ราบรื่นมากหรือน้อยเท่ากับการทำให้เรียบแบบเรียบง่ายของความแตกต่างแรก ขั้นตอนนี้เทียบเท่ากับการติดตั้งรุ่น ARIMA (0,2,2) โดยไม่มีค่าคงที่ที่สามารถนำมาใช้กับพอดีกับ ARIMA (0,2,2) (1-B) 2 xt (1teta1B theta2B2) น้ำหนัก การคำนวณค่าเฉลี่ยของข้อมูลเมทริกซ์โดยใช้ขนาดหน้าต่างที่ระบุในหน้าต่างในมิติสลัวโดยใช้อัลกอริธึมที่ระบุไว้ในตัวเลือก Dim และ option เป็นอินพุตตัวเลือกและจะใช้ค่าเริ่มต้นเป็น 1 Dim และ option optional inputs สามารถข้ามได้ทั้งหมดหรือสามารถแทนที่ด้วย a. ตัวอย่างเช่น movingmean (data, window) จะให้ผลลัพธ์เช่น movingmean (ข้อมูลหน้าต่าง 1,1) หรือ movingmean (ข้อมูลหน้าต่าง ,, 1) ข้อมูลเมทริกซ์ขนาดและมิติข้อมูลจะถูก จำกัด ด้วยขนาดเมตริกซ์สูงสุดสำหรับแพลตฟอร์มของคุณ หน้าต่างต้องเป็นจำนวนเต็มและควรเป็นเลขคี่ ถ้าหน้าต่างเป็นได้แล้วจะมีการปัดเศษลงไปที่เลขคี่ที่ต่ำกว่าถัดไป ฟังก์ชันจะคำนวณค่าเฉลี่ยเคลื่อนที่ที่รวมจุดกลางและ (window-1) 2 องค์ประกอบก่อนและหลังในมิติข้อมูลที่ระบุ ที่ขอบของเมทริกซ์จำนวนองค์ประกอบก่อนหรือหลังจะลดลงเพื่อให้ขนาดหน้าต่างที่เกิดขึ้นจริงน้อยกว่าหน้าต่างที่ระบุ ฟังก์ชันถูกแบ่งออกเป็นสองส่วนคืออัลกอริธึม 1d-2d และอัลกอริทึม 3 มิติ วิธีนี้ทำเพื่อเพิ่มประสิทธิภาพความเร็วในการแก้ปัญหาโดยเฉพาะในเมทริกซ์ขนาดเล็ก (เช่น 1000 x 1) นอกจากนี้อัลกอริทึมต่างๆในปัญหา 1d-2d และ 3d มีให้เช่นเดียวกับในบางกรณีอัลกอริทึมเริ่มต้นไม่เร็วที่สุด โดยทั่วไปจะเกิดขึ้นเมื่อเมทริกซ์กว้างมาก (เช่น 100 x 100000 หรือ 10 x 1000 x 1000) และค่าเฉลี่ยเคลื่อนที่จะคำนวณในมิติที่สั้นกว่า ขนาดที่อัลกอริทึมดีฟอลต์จะทำงานช้าลงจะขึ้นอยู่กับคอมพิวเตอร์ MATLAB 7.8 (R2009a) แท็กสำหรับไฟล์นี้โปรดล็อกอินเพื่อแท็กไฟล์ กรุณาเข้าสู่ระบบเพื่อเพิ่มความคิดเห็นหรือให้คะแนน ความคิดเห็นและการให้คะแนน (8) ฟังก์ชั่นเกี่ยวข้องกับปลายโดยการตัดส่วนท้ายหรือส่วนนำของหน้าต่างและเปลี่ยนเป็นค่าเฉลี่ยเคลื่อนที่ชั้นนำหรือต่อท้ายแทนที่จะเป็นจุดศูนย์กลาง ไปกับตัวอย่างที่คุณให้ไว้ในความคิดเห็นของคุณถ้าขนาดหน้าต่างอยู่ที่ 3 จากนั้นตรงกลาง 1 ฟังก์ชันค่าเฉลี่ยข้อมูลจากจุด 1 และ 2 ที่จุดศูนย์ 2 จุด 1, 2 และ 3 จะเฉลี่ยที่จุดศูนย์กลาง 9 จุดที่ 8, 9 และ 10 เป็นค่าเฉลี่ยและอยู่ที่ศูนย์ 10 (สมมุติว่าเวกเตอร์มี 10 รายการ) คะแนนเฉลี่ย 9 และ 10 movmean จัดการกับปลายไม่ว่าจะเริ่มต้นด้วยขนาดหน้าต่างที่ครอบคลุมเฉพาะจุด 1 ที่ 1 แล้ว 3 จุดที่จุด 2 แล้วเพิ่มขึ้นในขนาดหน้าต่างจนกว่าขนาดหน้าต่างที่ระบุไว้ในการป้อนข้อมูลฟังก์ชั่นขอบคุณ ดีและเรียบง่าย ขอขอบคุณ. งานที่ดีเป็นประโยชน์อย่างที่ Stephan Wolf กล่าว สิ่งที่ฉันกำลังมองหา ค่าเฉลี่ยเคลื่อนที่ที่ศูนย์กลางซึ่งสามารถทำงานในพล็อตเหนือความกว้างทั้งหมดโดยไม่ต้องมองหาขนาดหน้าต่างของตัวกรองและย้ายจุดเริ่มต้น เร่งการก้าวของวิศวกรรมและวิทยาศาสตร์ MathWorks เป็นผู้นำด้านการพัฒนาซอฟต์แวร์คอมพิวเตอร์สำหรับวิศวกรและนักวิทยาศาสตร์
Comments
Post a Comment