Tuesday 22 August 2017

อัต Vs เฉลี่ยเคลื่อนที่


ARIMA (p, d, q) สมการพยากรณ์: แบบจำลอง ARIMA เป็นทฤษฎีในชั้นเรียนทั่วไปของแบบจำลองสำหรับการคาดการณ์ชุดเวลาซึ่งสามารถทำให้เป็น 8220stationary8221 โดย differencing (ถ้าจำเป็น) อาจ ร่วมกับการแปลงที่ไม่ใช่เชิงเส้นเช่นการบันทึกหรือการลดน้ำหนัก (ถ้าจำเป็น) ตัวแปรสุ่มที่เป็นชุดเวลาจะหยุดนิ่งถ้าคุณสมบัติทางสถิติมีค่าคงที่ตลอดเวลา ชุดเครื่องเขียนมีแนวโน้มไม่มีรูปแบบแตกต่างกันไปโดยเฉลี่ยมีความกว้างคงที่และเลื้อยตามแบบที่สม่ำเสมอ กล่าวคือรูปแบบเวลาแบบสุ่มระยะสั้น ๆ มีลักษณะเหมือนกันในเชิงสถิติ เงื่อนไขหลังหมายความว่า autocorrelations (correlations กับความเบี่ยงเบนก่อนจากค่าเฉลี่ย) คงที่ตลอดเวลาหรือเทียบเท่าที่สเปกตรัมพลังงานคงที่ตลอดเวลา ตัวแปรสุ่มของแบบฟอร์มนี้สามารถดูได้ (ตามปกติ) เป็นสัญญาณและเสียงรวมกันและสัญญาณ (ถ้ามีปรากฏชัด) อาจเป็นรูปแบบการพลิกกลับค่าเฉลี่ยอย่างรวดเร็วหรือช้าหรือการสั่นของไซน์โซลาร์หรือการสลับสัญญาณอย่างรวดเร็ว และอาจมีส่วนประกอบตามฤดูกาล แบบจำลอง ARIMA สามารถดูได้ว่าเป็น 8220filter8221 ที่พยายามแยกสัญญาณออกจากเสียงและสัญญาณจะถูกอนุมานในอนาคตเพื่อให้ได้การคาดการณ์ สมการพยากรณ์ ARIMA สำหรับชุดเวลาแบบคงที่คือสมการเชิงเส้น (สมการถดถอย) ซึ่งตัวทำนายประกอบด้วยความล่าช้าของตัวแปรขึ้นอยู่กับและความล่าช้าของข้อผิดพลาดในการคาดการณ์ นั่นคือค่าที่คาดการณ์ของ Y คงที่และเป็นผลรวมถ่วงน้ำหนักของหนึ่งหรือมากกว่าค่าล่าสุดของ Y และหรือผลรวมถ่วงน้ำหนักของค่าข้อผิดพลาดล่าสุดหนึ่งค่าหรือมากกว่า ถ้าตัวทำนายประกอบด้วยค่า lag ที่ต่ำสุดของ Y มันเป็นโมเดล autoregressive บริสุทธิ์ (8220 self-regressed8221) ซึ่งเป็นเพียงกรณีพิเศษของรูปแบบการถดถอยและสามารถใช้กับซอฟต์แวร์การถดถอยแบบมาตรฐาน ตัวอย่างเช่นโมเดล autoregressive (8220AR (1) 8221) คำสั่งแรกสำหรับ Y เป็นรูปแบบการถดถอยแบบง่ายซึ่งตัวแปรอิสระมีเพียง Y lagged โดยหนึ่งช่วงเวลา (LAG (Y, 1) ใน Statgraphics หรือ YLAG1 ใน RegressIt) หากตัวทำนายบางตัวมีข้อผิดพลาดข้อผิดพลาดโมเดล ARIMA ไม่ใช่แบบจำลองการถดถอยเชิงเส้นเพราะไม่มีวิธีใดที่จะระบุข้อผิดพลาด 8222last period8217s error8221 เป็นตัวแปรอิสระ: ข้อผิดพลาดต้องคำนวณเป็นระยะ ๆ เป็นระยะ ๆ เมื่อโมเดลพอดีกับข้อมูล จากมุมมองด้านเทคนิคปัญหาเกี่ยวกับการใช้ข้อผิดพลาดที่ล่าช้าเป็นตัวพยากรณ์คือการคาดการณ์ model8217s ไม่ใช่หน้าที่เชิงเส้นของค่าสัมประสิทธิ์ แม้ว่าจะเป็นฟังก์ชันเชิงเส้นของข้อมูลที่ผ่านมา ดังนั้นค่าสัมประสิทธิ์ในแบบจำลอง ARIMA ที่มีข้อผิดพลาดที่ล้าหลังต้องถูกประมาณโดยวิธีการเพิ่มประสิทธิภาพแบบไม่เชิงเส้น (8220hill-climbing8221) แทนที่จะใช้เพียงการแก้สมการของสมการ ตัวย่อ ARIMA ย่อมาจาก Auto-Regressive Integrated Moving Average ความล่าช้าของชุดเครื่องเขียนในสมการพยากรณ์ถูกเรียกว่า quotautoregressivequot terms ความล่าช้าของข้อผิดพลาดในการคาดการณ์จะเรียกว่า quotmoving averagequot terms และชุดข้อมูลเวลาที่จะต้องมีความแตกต่างกันไปเพื่อที่จะทำให้ stationary ถูกกล่าวว่าเป็นชุด stationary ที่ไม่มีการเปลี่ยนแปลง โมเดลแบบสุ่มและแบบสุ่มแนวโน้มโมเดลอัตถิภาวนิยมและแบบจำลองการทำให้เรียบเป็นแบบเอกเทศเป็นกรณีพิเศษของแบบจำลอง ARIMA (p, d, q) quotario ซึ่งโดย: p คือจํานวนเงื่อนไขเชิงอัตรกรรม (autoregressive terms), d คือจํานวนความแตกต่างที่ไม่จำเป็นสำหรับ stationarity และ q คือจํานวนข้อผิดพลาดในการคาดการณ์ที่ล้าหลังใน สมการทำนาย สมการพยากรณ์ถูกสร้างขึ้นดังนี้ อันดับแรกให้ y แสดงความแตกต่าง d ของ Y ซึ่งหมายถึง: โปรดทราบว่าความแตกต่างที่สองของ Y (กรณี d2) ไม่ใช่ความแตกต่างจาก 2 ช่วงก่อนหน้า ค่อนข้างแตกต่างแรกของความแตกต่าง ซึ่งเป็นอนาล็อกแบบไม่ต่อเนื่องของอนุพันธ์ลำดับที่สองนั่นคือการเร่งความเร็วในท้องถิ่นของซีรีส์มากกว่าแนวโน้มในท้องถิ่น ในแง่ของ y สมการพยากรณ์ทั่วไปคือที่นี่มีการกำหนดค่าพารามิเตอร์เฉลี่ยเคลื่อนที่ (9528217s) เพื่อให้สัญญาณของพวกเขามีค่าเป็นลบในสมการดังต่อไปนี้ตามข้อเสนอของ Box and Jenkins ผู้เขียนบางคนและซอฟต์แวร์ (รวมถึงภาษาการเขียนโปรแกรม R) กำหนดไฟล์เหล่านั้นเพื่อให้มีเครื่องหมายบวกแทน เมื่อจำนวนจริงถูกเสียบเข้ากับสมการไม่มีความคลุมเครือ แต่สำคัญมากที่ทราบว่าการประชุมซอฟต์แวร์ของคุณใช้เมื่อคุณอ่านผลลัพธ์ บ่อยครั้งที่พารามิเตอร์จะแสดงด้วย AR (1), AR (2), 8230 และ MA (1), MA (2), 8230 เป็นต้นเพื่อระบุรูปแบบ ARIMA ที่เหมาะสมสำหรับ Y คุณจะเริ่มต้นด้วยการกำหนดลำดับของ differencing (d) จำเป็นต้องจัดลำดับชุดและลบคุณลักษณะขั้นต้นของฤดูกาลอาจเป็นผลมาจากการเปลี่ยนแปลงความแปรปรวน - เสถียรภาพเช่นการบันทึกหรือการลดราคา ถ้าคุณหยุดอยู่ที่จุดนี้และคาดการณ์ว่าซีรี่ส์ที่แตกต่างกันคือค่าคงที่คุณได้ติดตั้งแบบสุ่มหรือแบบจำลองแนวโน้มแบบสุ่มเท่านั้น อย่างไรก็ตามชุดเครื่องเขียนอาจมีข้อผิดพลาดที่อาจเกิดขึ้นได้เองซึ่งหมายความว่าคำจำกัดความของ AR บางข้อ (p 8805 1) และบางคำจำนวน MA (q 8805 1) ยังจำเป็นในสมการพยากรณ์ ขั้นตอนการกำหนดค่าของ p, d และ q ที่ดีที่สุดสำหรับชุดเวลาที่กำหนดจะกล่าวถึงในส่วนถัดไปของบันทึกย่อ (ซึ่งลิงก์อยู่ที่ด้านบนของหน้านี้) แต่เป็นการแสดงตัวอย่างบางส่วนของประเภท ของแบบจำลอง ARIMA แบบไม่ใช้เชิงเส้นที่มักพบคือด้านล่าง ARIMA (1,0,0) แบบจำลองอัตถดถอยอันดับแรก: ถ้าซีรี่ส์มีตำแหน่งนิ่งและสัมพันธ์กันอาจเป็นไปได้ว่าเป็นค่าหลายค่าของตนเองก่อนหน้าบวกค่าคงที่ สมการพยากรณ์ในกรณีนี้คือ 8230 ซึ่งเป็น Y ที่ถดถอยลงบนตัวของมันเองที่ล้าหลังไปหนึ่งช่วงเวลา นี่คือโมเดล 8220ARIMA (1,0,0) คงที่ 8221 ถ้าค่าเฉลี่ยของ Y เป็นศูนย์จะไม่มีการรวมค่าคงที่ ถ้าค่าสัมประสิทธิ์ความลาดชัน 981 1 เป็นค่าบวกและน้อยกว่า 1 ในขนาด (ต้องมีขนาดน้อยกว่า 1 ในกรณีที่ Y อยู่นิ่ง) รูปแบบนี้อธิบายถึงพฤติกรรมการคืนค่าเฉลี่ยซึ่งคาดว่าจะมีการคาดการณ์มูลค่า 8282 ของช่วงถัดไปเป็น 981 1 เท่าตาม ห่างไกลจากค่าเฉลี่ยเป็นค่า period8217s นี้ ถ้า 981 1 เป็นค่าลบจะคาดการณ์พฤติกรรมการคืนค่าเฉลี่ยด้วยการสลับสัญญาณซึ่งก็คือคาดการณ์ว่า Y จะอยู่ต่ำกว่าระยะเวลาถัดไปหากอยู่เหนือค่าเฉลี่ยในช่วงเวลานี้ ในแบบจำลองอัตถิภาวนิยมที่สอง (ARIMA (2,0,0)) จะมีระยะ Y t-2 อยู่ด้านขวาเช่นกันและอื่น ๆ ขึ้นอยู่กับสัญญาณและ magnitudes ของค่าสัมประสิทธิ์แบบ ARIMA (2,0,0) สามารถอธิบายระบบที่มีการพลิกกลับค่าเฉลี่ยที่เกิดขึ้นในรูปแบบการสั่น sinusoidally เช่นการเคลื่อนไหวของมวลในฤดูใบไม้ผลิที่อยู่ภายใต้แรงกระแทกแบบสุ่ม . ARIMA (0, 0) การเดินแบบสุ่ม: ถ้าชุด Y ไม่อยู่นิ่งแบบจำลองที่ง่ายที่สุดที่เป็นไปได้คือรูปแบบการเดินแบบสุ่มซึ่งถือได้ว่าเป็นรูปแบบ AR (1) ที่มีข้อ จำกัด ในการกำหนดอัตลักษณ์เชิงอัตรกรรม ค่าสัมประสิทธิ์เท่ากับ 1 คือชุดที่มีการพลิกกลับหมายถึงช้าอย่างไม่หยุดนิ่ง สมการทำนายสำหรับแบบจำลองนี้สามารถเขียนได้ว่า: โดยที่ระยะคงที่คือการเปลี่ยนแปลงระยะเวลาเฉลี่ยเป็นระยะ ๆ (เช่นการลอยตัวในระยะยาว) ใน Y โมเดลนี้สามารถใช้เป็นแบบจำลองการถดถอยแบบไม่มีการสกัดกั้นซึ่ง ความแตกต่างแรกของ Y คือตัวแปรอิสระ เนื่องจากมีเพียงความแตกต่างที่ไม่มีความแตกต่างกันและเป็นระยะคงที่จึงถูกจัดเป็นแบบ quotARIMA (0,1,0) ด้วย constant. quot แบบ random-walk-without - drift จะเป็น ARIMA (0.1, 0) โดยไม่มีค่าคงที่ ARIMA (1,1,0) differenced แบบจำลอง autoregressive ลำดับแรก: ถ้าข้อผิดพลาดของรูปแบบการเดินแบบสุ่มเป็น autocorrelated บางทีปัญหาสามารถแก้ไขได้โดยการเพิ่มหนึ่งล่าช้าของตัวแปรขึ้นอยู่กับสมการทำนาย - - ie โดยการถอยกลับความแตกต่างแรกของ Y บนตัวเองล้าหลังโดยระยะเวลาหนึ่ง นี่จะเป็นสมการทำนายต่อไปนี้: ซึ่งสามารถจัดเรียงใหม่ได้นี่คือแบบจำลองอัตถิภาวนิยมอันดับแรกที่มีลำดับความแตกต่างอย่างไม่มีเงื่อนไขและลำดับคงที่อย่างใดอย่างหนึ่ง แบบจำลอง ARIMA (1,1,0) ARIMA (0,1,1) โดยไม่มีการเรียบแบบ exponential เรียบง่ายอย่างสม่ำเสมอ: อีกวิธีหนึ่งสำหรับการแก้ไขข้อผิดพลาด autocorrelated ในแบบจำลองการเดินแบบสุ่มได้รับการแนะนำโดยใช้แบบเรียบง่าย จำได้ว่าในบางช่วงเวลาที่ไม่ต่อเนื่อง (เช่นคนที่แสดงความผันผวนที่มีเสียงดังรอบ ๆ ค่าเฉลี่ยที่เปลี่ยนแปลงไปอย่างช้าๆ) รูปแบบการเดินแบบสุ่มไม่ทำงานและค่าเฉลี่ยที่เคลื่อนไหวอยู่ในอดีต กล่าวอีกนัยหนึ่งแทนที่จะใช้การสังเกตล่าสุดเป็นคาดการณ์การสังเกตครั้งต่อไปจะเป็นการดีกว่าที่จะใช้ค่าเฉลี่ยของข้อสังเกตสุดท้ายไม่กี่ข้อเพื่อกรองสัญญาณรบกวนและประมาณค่าเฉลี่ยของท้องถิ่นอย่างแม่นยำมากขึ้น แบบจำลองการทำให้เรียบแบบเรียบง่ายใช้ค่าเฉลี่ยเคลื่อนที่ที่ถ่วงน้ำหนักแบบพหุคูณของค่าที่ผ่านมาเพื่อให้ได้ผลลัพธ์นี้ สมการทำนายสำหรับแบบเรียบง่ายชี้แจงสามารถเขียนในรูปแบบที่เท่าเทียมทางคณิตศาสตร์ หนึ่งในนั้นคือแบบฟอร์ม 8220error correction8221 ที่เรียกว่า 8220error ซึ่งเป็นที่คาดการณ์ก่อนหน้านี้ได้รับการปรับเปลี่ยนไปในทิศทางของข้อผิดพลาดที่เกิดขึ้นเนื่องจาก e t-1 Y t-1 - 374 t-1 ตามนิยามนี้สามารถเขียนใหม่ได้ : ซึ่งเป็นสมการพยากรณ์ ARIMA (0,1,1) โดยไม่ใช้ค่าคงที่กับ 952 1 1 - 945 ซึ่งหมายความว่าคุณสามารถใส่ข้อมูลการเรียบง่ายที่ชี้แจงได้โดยระบุว่าเป็นแบบ ARIMA (0,1,1) โดยไม่มี ค่าคงที่และค่าสัมประสิทธิ์ของค่าสัมประสิทธิ์ (1) โดยประมาณเท่ากับ 1-alpha ในสูตร SES จำได้ว่าในรูปแบบ SES อายุโดยเฉลี่ยของข้อมูลในการคาดการณ์ล่วงหน้า 1 รอบคือ 1 945 หมายความว่าพวกเขาจะมีแนวโน้มที่จะล่าช้าหลังแนวโน้มหรือจุดหักเหตามระยะเวลาประมาณ 1 945 เป็นไปตามที่อายุโดยเฉลี่ยของข้อมูลในการคาดการณ์ล่วงหน้า 1 รอบของรูปแบบ ARIMA (0,1,1) - ไม่ใช้แบบคงที่คือ 1 (1 - 952 1) ดังนั้นตัวอย่างเช่นถ้า 952 1 0.8 อายุเฉลี่ยอยู่ที่ 5 เมื่อ 952 1 วิธีที่ 1 ค่า ARIMA (0,1,1) - โดยไม่คิดค่าคงที่จะกลายเป็นค่าเฉลี่ยเคลื่อนที่ในระยะยาวและเป็น 952 1 แนวทาง 0 มันกลายเป็นแบบสุ่มเดินโดยปราศจาก drift What8217s วิธีที่ดีที่สุดในการแก้ไข autocorrelation: การเพิ่ม AR terms หรือการเพิ่มเงื่อนไข MA ในสองโมเดลก่อนหน้าที่กล่าวข้างต้นปัญหาของความผิดพลาด autocorrelated ในแบบจำลองการเดินแบบสุ่มได้รับการแก้ไขในสองวิธีด้วยกันโดยการเพิ่มค่า lagged ของชุด differenced สมการหรือเพิ่มค่า lag ของข้อผิดพลาดในการคาดการณ์ แนวทางที่ดีที่สุดกฎของหัวแม่มือสำหรับสถานการณ์นี้ซึ่งจะมีการกล่าวถึงในรายละเอียดเพิ่มเติมในภายหลังว่าการเชื่อมโยงความสัมพันธ์ในทางบวกมักจะได้รับการปฏิบัติที่ดีที่สุดโดยการเพิ่มเทอม AR ไปยังโมเดลและการเชื่อมโยงกันในทางลบมักได้รับการปฏิบัติที่ดีที่สุดโดยการเพิ่ม ระยะ MA ในช่วงเวลาทางธุรกิจและเศรษฐกิจอัตลักษณ์เชิงลบมักเกิดขึ้นเป็นสิ่งประดิษฐ์ของความแตกต่าง (โดยทั่วไป differencing ลด autocorrelation บวกและอาจทำให้เกิดการเปลี่ยนจาก autocorrelation บวกกับลบ.) ดังนั้นรูปแบบ ARIMA (0,1,1) ซึ่ง differencing จะมาพร้อมกับระยะ MA จะใช้บ่อยกว่า ARIMA (1,1,0) รุ่น ARIMA (0,1,1) พร้อมกับการเรียบอย่างสม่ำเสมอด้วยการเพิ่มขึ้นอย่างรวดเร็ว: เมื่อใช้โมเดล SES เป็นแบบ ARIMA คุณจะได้รับความยืดหยุ่นบางอย่าง ประการแรกประเมินค่าสัมประสิทธิ์ของค่าสัมประสิทธิ์การใช้ไฟฟ้า (MA) (1) เป็นค่าลบ นี้สอดคล้องกับปัจจัยราบรื่นที่มีขนาดใหญ่กว่า 1 ในรูปแบบ SES ซึ่งโดยปกติจะไม่ได้รับอนุญาตตามขั้นตอนแบบ SES เหมาะสม ประการที่สองคุณมีตัวเลือกในการรวมระยะเวลาคงที่ในรูปแบบ ARIMA หากต้องการเพื่อประเมินแนวโน้มโดยเฉลี่ยที่ไม่ใช่ศูนย์ โมเดล ARIMA (0,1,1) มีค่าคงที่มีสมการทำนาย: การคาดการณ์ล่วงหน้าหนึ่งรอบจากแบบจำลองนี้มีคุณภาพคล้ายคลึงกับแบบจำลอง SES ยกเว้นว่าวิถีของการคาดการณ์ระยะยาวโดยทั่วไปคือ (ซึ่งมีความลาดชันเท่ากับ mu) มากกว่าเส้นแนวนอน ARIMA (0,2,1) หรือ (0,2,2) โดยไม่มีการเพิ่มความเรียบแบบเสียดสีเชิงเส้นแบบคงที่: โมเดลเรียบเรียงเชิงตัวเลขเป็นแบบเชิงเส้นเป็นแบบจำลอง ARIMA ซึ่งใช้ความแตกต่างกันตามคำต่าง ๆ สองแบบร่วมกับข้อกำหนดของ MA ความแตกต่างที่สองของซีรีส์ Y ไม่ใช่แค่ความแตกต่างระหว่าง Y กับตัวเองที่ล้าหลังไปสองช่วงคือความแตกต่างแรกของความแตกต่างแรกคือ การเปลี่ยนแปลงการเปลี่ยนแปลงของ Y ที่ระยะเวลา t ดังนั้นความแตกต่างที่สองของ Y ที่ระยะเวลา t เท่ากับ (Y t - Y t-1) - (Y t-1 - Y t-2) Y t-2Y t-1 Y t-2 ความแตกต่างที่สองของฟังก์ชันแบบไม่ต่อเนื่องมีลักษณะคล้ายคลึงกับอนุพันธ์ที่สองของฟังก์ชันต่อเนื่อง: วัดการอ้างอิงหรือ quotcurvaturequot ในฟังก์ชันตามจุดที่กำหนดในเวลา แบบจำลอง ARIMA (0,2,2) โดยไม่มีค่าคงที่คาดการณ์ว่าความแตกต่างที่สองของชุดเท่ากับฟังก์ชันเชิงเส้นของข้อผิดพลาดในการคาดการณ์สองข้อสุดท้าย: ซึ่งสามารถจัดเรียงใหม่ได้ว่า: ที่ 952 1 และ 952 2 เป็น MA (1) และ MA (2) ค่าสัมประสิทธิ์ นี่คือแบบจำลองการเพิ่มความเรียบแบบเชิงเส้นแบบทั่วไป เป็นหลักเช่นเดียวกับรุ่น Holt8217s และรุ่น Brown8217s เป็นกรณีพิเศษ ใช้ค่าเฉลี่ยเคลื่อนที่แบบถ่วงน้ำหนักแบบทวีคูณเพื่อประมาณทั้งระดับท้องถิ่นและแนวโน้มท้องถิ่นในชุด การคาดการณ์ในระยะยาวจากรุ่นนี้มาบรรจบกันเป็นเส้นตรงซึ่งความลาดชันขึ้นอยู่กับแนวโน้มโดยเฉลี่ยที่สังเกตได้จากช่วงปลายชุด ARIMA (1,1,2) โดยไม่ทำให้เกิดความเรียบแบบเสียดสีเชิงเส้นแบบลดแรงเสียดทาน โมเดลนี้แสดงในภาพนิ่งที่มาพร้อมกับรุ่น ARIMA คาดการณ์แนวโน้มในท้องถิ่นในตอนท้ายของซีรี่ส์ แต่แผ่ออกไปในขอบเขตที่คาดการณ์อีกต่อไปเพื่อนำเสนอข้อความเกี่ยวกับอนุรักษนิยมซึ่งเป็นแนวปฏิบัติที่ได้รับการสนับสนุนเชิงประจักษ์ ดูบทความเกี่ยวกับสาเหตุที่ทำไมผลงาน Trend ที่มีการกระแทกโดย Gardner and McKenzie และบทความ quotGolden Rulequot โดย Armstrong et al. สำหรับรายละเอียด เป็นที่แนะนำโดยทั่วไปให้ยึดติดกับโมเดลซึ่งอย่างน้อยหนึ่ง p และ q ไม่ใหญ่กว่า 1 คือไม่พยายามให้พอดีกับรูปแบบเช่น ARIMA (2,1,2) เนื่องจากมีแนวโน้มที่จะนำไปสู่การ overfitting และปัญหา quotcommon-factorquot ที่กล่าวถึงในรายละเอียดเพิ่มเติมในบันทึกย่อเกี่ยวกับโครงสร้างทางคณิตศาสตร์ของโมเดล ARIMA การใช้งานสเปรดชีต: โมเดล ARIMA เช่นที่อธิบายข้างต้นใช้งานง่ายในสเปรดชีต สมการทำนายเป็นเพียงสมการเชิงเส้นที่อ้างถึงค่าที่ผ่านมาของซีรีส์เวลาเดิมและค่าที่ผ่านมาของข้อผิดพลาด ดังนั้นคุณสามารถตั้งค่าสเปรดชีตการพยากรณ์ ARIMA ได้โดยจัดเก็บข้อมูลในคอลัมน์ A สูตรพยากรณ์ในคอลัมน์ B และข้อผิดพลาด (ข้อมูลลบการคาดการณ์) ในคอลัมน์ C สูตรการคาดการณ์ในเซลล์ทั่วไปในคอลัมน์ B จะเป็นเพียง การแสดงออกเชิงเส้นหมายถึงค่าในแถวก่อนหน้าของคอลัมน์ A และ C คูณด้วยค่าสัมประสิทธิ์ของ AR หรือ MA ที่เหมาะสมที่เก็บไว้ในเซลล์ในที่อื่น ๆ ในสเปรดชีตสิ่งที่มีการเคลื่อนที่อัตโนมัติ (AR) ค่าเฉลี่ยเคลื่อนที่ (MA) และการเคลื่อนที่แบบผสม (ARMA กระบวนการทำงานอัตโนมัติแบบหยุดนิ่ง (AR) ขั้นตอน autoregressive stationary (AR) มีฟังก์ชัน autocorrelation ทางทฤษฎี (ACFs) ที่สลายไปทางศูนย์แทนการตัดเป็นศูนย์ ค่าสัมประสิทธิ์การคลาดเคลื่อน (autocorrelation coefficients) อาจสลับกันในการลงชื่อเข้าใช้บ่อยๆหรือแสดงรูปแบบคล้ายคลื่น แต่ในทุกกรณีจะเลื่อนไปทางศูนย์ ในทางตรงกันข้ามกระบวนการ AR ที่มีลำดับ p มีฟังก์ชัน autocorrelation เชิงทฤษฎีบางส่วน (PACF) ที่ตัดไปเป็นศูนย์หลังจาก lag p ค่าเฉลี่ยของกระบวนการย้าย (MA) กระบวนการทางทฤษฎี (ACFs) ของกระบวนการ MA (ค่าเฉลี่ยเคลื่อนที่) ด้วยคำสั่ง q ตัดเป็นศูนย์หลังจากล้าหลัง, คำสั่ง MA ของกระบวนการ อย่างไรก็ตามทฤษฎี PACF จะสลายตัวไปยังศูนย์ (ARMA) ขั้นตอนการผสมแบบคงที่ (ARMA) แสดงส่วนผสมของ AR และ MA ลักษณะเฉพาะ (ARMA) ทั้งทฤษฎี ACF และ PACF หางไปสู่ศูนย์ ลิขสิทธิ์ 2016 Minitab Inc. สงวนลิขสิทธิ์ทั้งหมดมีหลายวิธีในการสร้างแบบจำลองชุดเวลา เราร่างแนวทางที่พบบ่อยที่สุดบางส่วนด้านล่าง เทรนด์, ฤดูกาล, Decompositions ที่เหลือวิธีหนึ่งคือการสลายชุดข้อมูลเวลาเป็นองค์ประกอบตามฤดูกาลและส่วนที่เหลือ การเพิ่มความเรียบเป็นรูปสามส่วนเป็นตัวอย่างของแนวทางนี้ อีกตัวอย่างหนึ่งที่เรียกว่าดินอ่อนตามฤดูกาลขึ้นอยู่กับพื้นที่ที่มีการถ่วงน้ำหนักน้อยที่สุดในท้องถิ่นและได้รับการกล่าวถึงโดยคลีฟแลนด์ (1993) เราไม่ได้พูดถึงเรื่อง "lessess" ตามฤดูกาลในคู่มือเล่มนี้ วิธีการใช้คลื่นความถี่ (Frequency Based Methods) อีกวิธีหนึ่งที่ใช้กันทั่วไปในการประยุกต์ใช้ทางวิทยาศาสตร์และวิศวกรรมคือการวิเคราะห์ชุดข้อมูลในโดเมนความถี่ ตัวอย่างของวิธีการนี้ในการสร้างแบบจำลองชุดข้อมูลประเภทไซน์ (sinusoidal type data set) จะแสดงในกรณีศึกษาการเบี่ยงเบนของลำแสง พล็อตสเปกตรัมเป็นเครื่องมือหลักสำหรับการวิเคราะห์ความถี่ของชุดเวลา โมเดลอัตถดถอย (Autoregressive: AR) วิธีการทั่วไปสำหรับการสร้างโมเดลชุดเวลาที่ไม่มีการแปรผกผันเป็นแบบจำลองอัตถิภาวนิยม (AR): Xt delta phi1 X Phi2 X cdots phip X ที่ตำแหน่ง (Xt) คือชุดข้อมูลเวลา (At) เป็นสัญญาณรบกวนสีขาวและเดลต้า left (1 - sum p phii ด้านขวา) mu กับ (mu) denoting หมายถึงกระบวนการ แบบจำลองอัตถิภาวนิยมเป็นเพียงการถดถอยเชิงเส้นของค่าปัจจุบันของชุดต่อหนึ่งหรือมากกว่าค่าก่อนหน้าของชุด ค่าของ (p) เรียกว่าลำดับของรูปแบบ AR แบบจำลอง AR สามารถวิเคราะห์ด้วยวิธีการต่างๆรวมถึงเทคนิคเชิงเส้นอย่างน้อยที่สุดเชิงเส้น พวกเขายังมีการตีความตรงไปตรงมา โมเดลการเคลื่อนที่แบบเฉลี่ย (MA) อีกวิธีหนึ่งที่ใช้กันทั่วไปในการสร้างโมเดลโมเดลเวลา univariate คือค่าเฉลี่ยเคลื่อนที่ (MA): Xt mu At - theta1 A - theta2 A - cdots - thetaq A โดยที่ (Xt) คือชุดข้อมูลเวลา (mu) ) เป็นค่าเฉลี่ยของชุด, (A) เป็นเงื่อนไขการรบกวนสีขาวและ (theta1,, ldots,, thetaq) เป็นพารามิเตอร์ของแบบจำลอง ค่าของ (q) เรียกว่าลำดับของแบบจำลอง MA นั่นคือแบบจำลองค่าเฉลี่ยเคลื่อนที่เป็นแนวคิดการถดถอยเชิงเส้นของค่าปัจจุบันของชุดเทียบกับสัญญาณรบกวนสีขาวหรือแรงกระแทกแบบสุ่มของค่าก่อนหน้าอย่างน้อยหนึ่งค่าของชุดข้อมูล การสุ่มกระแทกที่แต่ละจุดจะสันนิษฐานว่ามาจากการแจกจ่ายเดียวกันโดยปกติแล้วจะมีการแจกแจงแบบปกติโดยมีตำแหน่งอยู่ที่ศูนย์และระดับคงที่ ความแตกต่างในรูปแบบนี้คือการสุ่มเหล่านี้เป็นแรงกระตุ้นต่อค่าในอนาคตของชุดข้อมูลเวลา การใส่ค่าประมาณของ MA มีความซับซ้อนมากกว่าโมเดล AR เนื่องจากข้อผิดพลาดไม่สามารถสังเกตได้ ซึ่งหมายความว่าจำเป็นต้องใช้ขั้นตอนการกระชับแบบไม่เชิงเส้นซ้ำในตำแหน่งของสี่เหลี่ยมเชิงเส้นอย่างน้อยที่สุด MA รุ่นยังมีการตีความชัดเจนน้อยกว่ารุ่น AR บางครั้ง ACF และ PACF จะแนะนำว่ารูปแบบของ MA จะเป็นทางเลือกที่ดีกว่าและบางครั้งทั้ง AR และ MA ควรใช้ในรูปแบบเดียวกัน (ดูหัวข้อ 6.4.4.5) อย่างไรก็ตามโปรดทราบว่าข้อผิดพลาดหลังจากแบบจำลองเหมาะสมควรเป็นอิสระและปฏิบัติตามสมมติฐานมาตรฐานสำหรับกระบวนการที่ไม่เหมือนกัน กล่องและเจนกินส์นิยมใช้วิธีการที่รวมค่าเฉลี่ยเคลื่อนที่และวิธีอัตมั่งอัตมัยเข้าไว้ในหนังสือ Time Series Analysis: การพยากรณ์และการควบคุม (กล่องเจนกินส์และ Reinsel, 1994) แม้ว่าทั้งสองวิธีจะเป็นที่ทราบกันดีอยู่แล้ว (และได้รับการตรวจสอบครั้งแรกในเทศกาลคริสต์มาส) การมีส่วนร่วมของ Box และ Jenkins ในการพัฒนาวิธีการที่เป็นระบบในการระบุและประเมินแบบจำลองที่สามารถใช้ทั้งสองวิธีได้ ทำให้ Box-Jenkins เป็นโมเดลที่มีประสิทธิภาพมากขึ้น ส่วนถัดไปจะกล่าวถึงรายละเอียดในรูปแบบเหล่านี้

No comments:

Post a Comment